JPH0926800A - 音声符号化システム - Google Patents

音声符号化システム

Info

Publication number
JPH0926800A
JPH0926800A JP8153652A JP15365296A JPH0926800A JP H0926800 A JPH0926800 A JP H0926800A JP 8153652 A JP8153652 A JP 8153652A JP 15365296 A JP15365296 A JP 15365296A JP H0926800 A JPH0926800 A JP H0926800A
Authority
JP
Japan
Prior art keywords
pulse
signal
vector
pulses
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8153652A
Other languages
English (en)
Inventor
Dror Nahumi
ナフミ ドラー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
A T and T I P M CORP
AT&T Corp
Original Assignee
A T and T I P M CORP
AT&T Corp
AT&T IPM Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by A T and T I P M CORP, AT&T Corp, AT&T IPM Corp filed Critical A T and T I P M CORP
Publication of JPH0926800A publication Critical patent/JPH0926800A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 演算の負担を軽減し、かつ従来の強引手法に
近い正確さをもつコードブックサーチ技術を提供する。 【解決手段】 音声パラメータを複数の一時的な連続フ
レーム中に符号化する音声符号化システムにおいて、マ
ルチパルスベクトルが、各フレームから合成され、残留
信号スペシファイヤとしての役目を果たす。マルチパル
スベクトルは、所定のフレームに対応する複数のパルス
の一時的な関係を特定し、複数のサンプル位置を含む。
各サンプル位置において、ベクトル内のサンプル位置に
おけるパルスの存在、不在および/または符号を表す値
が格納される。所定のマルチパルスベクトル内の複数の
パルス位置は、ソース信号およびマルチパルスベクトル
により表現された量子化されたパルス列との2乗平均誤
差を最小化するように最適化される。この代わりに、パ
ルス位置は、ソース信号と量子化されたパルス列との知
覚的に重み付けされた2乗平均誤差を最小化するように
最適化することもできる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般に音声分析に
係り、特に1つまたは2つ以上のコードブックテーブル
を使用する線形予測音声パターン分析に関する。
【0002】
【従来の技術】線形予測符号化(LPC)は、デジタル
音声伝送、音声認識および音声合成のような技術との組
み合わせで使用されてきた。LPC符号化は、音声信号
を1つまたは2つ以上の音声パラメータの形で表現する
ことにより、音声処理技術の効率を向上させる。例え
ば、第1の音声パラメータを人間の発声器官の形状を表
すように選択でき、第2の音声パラメータを発声器官の
刺激を表すように選択することができる。この音声パラ
メータにより占められる帯域幅は、オリジナルの音声信
号により占められる帯域幅よりも実質的に小さい。
【0003】LPC符号化技術は、音声パラメータを一
連の時間フレーム区間に区分する。各フレームは、5な
いし20ミリ秒の範囲の時間である。この音声パラメー
タは、人間の発声器官を模擬する線形予測フィルタに加
えられる。人間の発声器官に加えられるべき刺激を表す
音声パラメータに応じて、線形予測フィルタは、オリジ
ナルの音声信号の複製を復元する。このような構成の例
示的なシステムは、B.S.Atalに対して発行され
た米国特許第3,624,302号および米国特許第
4,701,954号に記載されている。
【0004】発声器官の刺激を表す音声パラメータは、
発音された音声に対するピッチ遅れ信号および発音され
ない音声に対する雑音信号の形をとり得る。予測残留刺
激信号は、所定のフレームを生成するために使用される
実際の音声信号とこのフレーム中に格納されたLPCパ
ラメータに応答して生成される音声信号との違いを表す
ために使用される。予測残差が音声信号の非予測部分に
対応するという事実のために、この残留信号は幾分雑音
のようなものであり、相対的に広い帯域幅を占める。
【0005】量子化された残留信号に割り当てられる帯
域幅を制限することは可能である。1つの方法は、所定
のフレームに対応するオリジナルの音声信号とLPCパ
ラメータから得られる音声信号との差を考慮することに
より、複数のパルスから構成されるマルチパルス信号で
各連続的なフレームについての残留信号をシミュレート
することである。予測残差を量子化するために使用され
るマルチパルス信号のビットレートは、禁止された伝送
および記憶の要求に順応させるために選択され得る。
【0006】フレームの残留信号が、32個のサンプル
により表現されると仮定すると、組み立てられたマルチ
パルス信号は、例えば32個のパルスを含むことができ
る。この32個のパルスは、32のサイズを有するベク
トルとして概念化することができ、このベクトルは「ベ
クトルテーブル」から検索することができる。このよう
なテーブルの中のエントリーの数が、この場合における
ように非常に大きい場合、テーブルのエントリーは、作
動中に「オンザフライ(on the fly)」、即ちリアルタ
イムで構成される。現実のテーブルはないが、コードブ
ックテーブルのエントリーサーチの意味における音声が
ある。
【0007】また、ベクトルは4行8列の二次元配列と
して概念化することができる。ここで、第1列はサンプ
ル位置0,1,2,3を含み、第2列はサンプル位置
4,5,6,7を含み、第8列は、サンプル位置28,
29,30,31を含む。これは、以下に示すように、
ベクトルの自由度を任意に制限することにおける便宜の
ためである。各サンプル位置において、ベクトル内のサ
ンプル場所におけるパルスの存在、または不在を表す値
が格納される。正のパルスが存在する場合にはこの格納
される値は1であり、パルスが存在しない場合にはこの
格納される値は0であり、負のパルスが存在する場合に
は格納される値は−1である。
【0008】各サンプル位置について適切な値を決定す
るプロセスは、コードブックテーブルのサーチと呼ぶこ
とができる。コードブックサーチを実行する1つの実在
する方法は、強引(brute force)手法と呼ぶことがで
き、サンプル位置に全ての可能性のある値の組み合わせ
を割当て、現実の音声信号とLPCパラメータから復元
された音声信号との最小2乗平均誤差を有するサンプル
位置の最適な組み合わせを選択する。この2乗平均誤差
を最小化するプロセスは、波形マッチングとも呼ばれ
る。実際の2乗平均誤差が測定されるか、または知覚的
に重み付けされた2乗平均誤差が測定される。この誤差
が測定される前に、復元された信号は、適切な重み付け
フィルタを通る。
【0009】強引手法の一例を以下に示す。ベクトルの
二次元表現における各水平ラインにおいて、ただ1つの
パルスだけが許されると仮定する。サンプル位置0,
1,2,3において始める。これらのサンプル位置のそ
れぞれにおいて正のパルスが存在すると仮定し、オリジ
ナルの音声信号とLPCパラメータから復元された音声
信号との2乗平均誤差を測定する。次に、これらのサン
プル場所のそれぞれにおいて負のパルスが存在すると仮
定して、2乗平均誤差を測定する。
【0010】サンプル位置の各水平行について17個の
可能な値の組み合わせがある。これらの17個の組み合
わせは、パルスが存在しないこと、8個の可能な位置の
いずれかにおいて正のパルスが存在すること、および8
個の可能な位置のいずれかにおいて負のパルスが存在す
ることである。考慮すべき4個の水平行があるので、強
引手法を使用してコードブックサーチを完了するために
は、全体で17の4乗回(83,521回)のサーチが
必要とされる。このようなアプローチは、システムハー
ドウェアに大きな演算能力を要求する。また、演算処理
速度に害を与える。
【0011】パルスのコードブックテーブルをサーチす
る他の現存する方法は、コードブックサーチ手続きの波
形マッチング性能を控えめにすることにより、2乗平均
誤差の量を増加させることである。例えば、パルスが
「直交」(即ち、与えられるパルスは他のいかなるパル
スにも影響を与えないと考えられる)していると仮定し
た場合、サーチはコードブックテーブルの所定の行内で
開始される。全ての可能な組み合わせ−1,0,1がこ
の所定の行内のサンプル位置中に入れられ、最小2乗平
均誤差を得る組み合わせが選択される。この手続きは、
全ての行が考慮されるまで、次の行について繰り返され
る。全体で17×4回のサーチ(即ち68回のサーチ)
だけが必要とされる。この手続きは、知覚的重み付けフ
ィルタが使用される場合に、このフィルタのインパルス
応答に依存して、不正確または最適以下の結果となり得
る。知覚的重み付けフィルタの構成および機能は、図4
を参照して後述する。
【0012】
【発明が解決しようとする課題】2乗平均誤差が知覚フ
ィルタにより重み付けされる場合、事実上、全ての知覚
フィルタの設計は、ある量の望ましくないリンギングを
提供する。このリンギングは、フィルタが、パルスを含
むサンプル位置の後に生じる複数のサンプル位置におけ
る応答を示すことを意味する。結果として、コードブッ
クサーチが、パルスを置くべきでないサンプル位置にパ
ルスを誤って置き、システムの性能を低下させる可能性
がある。低減された性能のサーチの演算的な便宜性と強
引手法に近い正確性を組み合わせたコードブックサーチ
技術が必要とされている。
【0013】
【課題を解決するための手段】音声パラメータを複数の
一時的な連続フレーム中に符号化する音声符号化システ
ムにおいて、マルチパルスベクトルが、各フレームから
合成され、残留信号スペシファイヤとしての役目を果た
す。マルチパルスベクトルは、所定のフレームに対応す
る複数のパルスの一時的な関係を特定し、複数のサンプ
ル位置を含む。各サンプル位置において、ベクトル内の
サンプル位置におけるパルスの存在、不在および/また
は符号を表す値が格納される。所定のマルチパルスベク
トル内の複数のパルスの位置は、ソース信号およびマル
チパルスベクトルにより表現された量子化されたパルス
列との2乗平均誤差(波形マッチング誤差とも呼ばれ
る)を最小化するように最適化される。この代わりに、
パルスの場所は、ソース信号と量子化されたパルス列と
の知覚的に重み付けされた2乗平均誤差を最小化するよ
うに最適化することもできる。このパルス位置の最適化
は、コードブックテーブルサーチと呼ばれる。
【0014】本発明の一実施形態によれば、コードブッ
クテーブルをサーチする単純化された方法が提供され
る。この方法は、複数のパルスについてのサーチを、増
加するパルス重要性から減少するパルス重要性への順序
で、一度に1つのパルスについて実行される。ここでパ
ルスの重要性は、所定のパルスがソース信号と量子化さ
れたパルス列との2乗平均誤差を最小化する相対的な寄
与(contribution)として定義される。
【0015】
【発明の実施の形態】図1は、本発明の一実施形態によ
るコードブックテーブルサーチ技術の全体的な動作環境
を示すハードウェアブロック図である。音声信号源10
0は、通常の音声コーダフロントエンド101に結合さ
れている。音声コーダフロントエンド101は、アナロ
グ−デジタルコンバータ、1つまたは2つ以上の周波数
選択フィルタ、デジタルサンプリング回路、および/ま
たは線形予測コーダ(LPC)のような構成要素を含み
得る。例えば、音声コーダフロントエンド101は、本
出願人に譲渡された米国特許出願第5,339,384
号に記載されたタイプのLPCを含むことができる。
【0016】音声コーダフロントエンド101の具体的
な内部構成と関係なく、このコーダは、オリジナルの入
力音声信号とは異なる領域における第1の出力信号を生
成する。そのような領域の一例は残留領域であり、この
場合、第1の出力信号は量子化された残留信号114で
ある。また、音声コーダフロントエンド101は、1つ
または2つ以上の音声パラメータ123の形での第2の
出力を提供する。音声コーダフロントエンド101から
の出力信号は、一時的な連続フレーム中に組織化され
る。この例において、音声コーダフロントエンド101
の出力は、残留領域における量子化された残留信号11
4を含む。この量子化された残留信号114は、誤差信
号115と最適一致ベクトル117との波形マッチンク
誤差を最小化するために、量子化されるべき信号を特定
する。
【0017】量子化された残留信号114は、第1の加
算回路102の第1の非反転入力に結合される。誤差信
号115からなる第1の加算回路102の出力は、固定
コードブック104に与えられる。この代わりに、第1
の加算回路102の出力は、固定コードブック104に
誤差信号115としてこの出力が与えられる前に、任意
の知覚的重み付けフィルタ112により処理され得る。
知覚的重み付けフィルタ112は、加算回路102の出
力信号を変換して、人間の知覚に比較的重要なインパク
トを与えるこの出力信号の部分を大きく強調し、人間の
知覚に相対的に重要なインパクトを与えないこの出力信
号の部分を余り強調しない。最適一致ベクトル117
が、誤差信号115の値に基づいて固定コードブック1
04から検索される。
【0018】最適一致ベクトル117は、第2の加算回
路121の第1の非反転入力に与えられる。第2の加算
回路121の出力は、量子化された残留信号113の近
似値の形で、信号記憶バッファ108に与えられる。量
子化された残留信号113の近似値は、図1の構成の出
力を表すものとして概念化することができる。信号記憶
バッファ108は、例えば所定のフレームの直前のフレ
ームのような1つまたは2つ以上の以前のフレームに対
応する量子化された残留信号113の近似値を格納す
る。記号記憶バッファ108の出力116は、量子化さ
れた残留信号114の以前の刺激についての近似された
残留信号を表す。出力116は、可変利得増幅器110
に結合されており、増幅器110の出力は可変遅延線1
06により処理される。可変遅延線106は、増幅器1
10の出力に選択された量の一時的な遅延を加えるため
に設けられている。可変遅延線106の出力は、以前の
フレーム127の量子化された残留信号の近似値を表
す。この以前のフレーム127の量子化された信号の近
似値は、第1の加算回路102の第2の反転入力に加え
られ、第2の加算回路121の第2の非反転入力にも加
えられる。
【0019】加算回路102の出力は、固定コードブッ
ク104に索引を付けるために使用される誤差信号11
5である。固定コードブック104は、1つまたは2つ
以上のマルチパルスベクトルを含む。各マルチパルスベ
クトルは、所定のフレームに対応する複数のパルスの一
時的な関係を特定する。ベクトルを様々な構成におい
て、配置することが可能である。この例において、ベク
トルはm行n列の二次元行列に構成されており、行列内
の各位置はサンプル位置を特定する。各サンプル位置に
おいて、ベクトル内のサンプル位置におけるパルスの存
在、不在、および/または符号を表す値が格納される。
例示的な固定コードブックの組織的トポロギーは、ヨー
ロッパのGSM(Global System for Mobile)標準およ
びIS54標準に記述されている。コードブックインデ
ックスは、固定コードブック104に索引を付けるため
に使用される。固定コードブック104から検索された
値は、抽出された刺激コードベクトルを表す。この抽出
されたコードベクトルは、オリジナルの音声信号と最も
良く一致するものとしてエンコーダにより決定されたも
のである。各抽出されたコードベクトルは、通常の利得
増幅回路を使用してスケーリングおよび/または正規化
することができる。
【0020】図2は、この実施形態と組み合わせて使用
されるコードブックテーブル200の一例を示すデータ
構造図である。コードブックテーブル200は、複数の
サンプル数のそれぞれを対応するパルス値と関連づけ
る。この方法において、各コードテーブル200は、所
定のフレームに対応する複数のパルスの一時的な関係を
特定する。このテーブルは、4行8列の二次元行列に構
成され、この行列内の各位置は、サンプル位置を特定す
る。この例において説明のために4×8行列が示されて
いるが、どのような便宜な次元または構造の行列も使用
することができる。
【0021】各サンプル位置において、ベクトル内のサ
ンプル位置におけるパルスの存在、不在、および/また
は符号を表す値が格納されている。この例において、値
+1は正のパルスの存在を意味し、値−1は負のパルス
の存在を意味し、値0はパルスの不存在を意味する。例
えば、サンプル位置0および18に正のパルスがある。
負のパルスはサンプル位置9および11にあり、残りの
サンプル位置はパルスを含んでいない。
【0022】コードブックテーブルの固有の符号化効率
を向上させるために、パルスを含むことを有されたサン
プル位置を拘束することができる。例えば、1つの拘束
の例は、コードブックテーブル200のいずれかの水平
行上で2つ以上のパルスの存在を禁止することである。
別の例示的な制限は、直接的に近接する(即ち接する)
サンプル位置におけるパルスの存在を禁止することであ
る。1つまたは2つ以上の制限を許容テーブル300中
に含めることができ、コードブックテーブルサーチに関
連して制限を加えるための効率的な技術を提供すること
ができる。
【0023】任意の知覚的重み付けフィルタ112が使
用される場合、事実上、全ての実際のフィルタ構成は、
図4に詳細に示されているようにリンギングして連続的
なパルスとなるインパルス応答を提供する。これらの状
況下において、正確なコードブックサーチは、全ての可
能性のあるパルス位置の和を必要とするように見える。
図2に示されているようなコードブックテーブル200
が使用され、このコードブックテーブル200の各水平
行には1つだけのパルスという制限が適応される場合、
サーチは最大で17の4乗回のサーチを必要とする。各
サンプル位置は、3つの可能な値の内の1つ、−1,0
または1をとることができる。この技術は最適な全体的
な波形一致、即ち最も小さい2乗平均誤差を有する波形
一致を提供するが、このような徹底的なサーチは、多く
の実際的な用途にとって複雑かつ資源集約的すぎるもの
である。したがって、本発明の様々な好ましい実施形態
によれば、上述の徹底的なサーチを逐次的なパルスサー
チに置き換える改良されたサーチ手続きが使用される。
【0024】ここに開示される改良されたサーチ手続き
は、音声パラメータを複数の仮の連続的なフレーム中に
符号化する音声符号化システムに適応可能である。マル
チパルスベクトルが各フレームから合成される。このマ
ルチパルスベクトルは、所定のパルスに対応する複数の
パルスの一時的な関係を特定し、複数のサンプル位置を
含む。各サンプル位置において、ベクトル内のサンプル
位置におけるパルスの存在、不存在、および/または符
号を表す値が格納される。所定のマルチパルスベクトル
内の複数のパルスの位置は、ソース信号とマルチパルス
ベクトルにより表現された量子化されたパルス列との2
乗平均誤差(波形マッチングエラーとも呼ばれる)を最
小化するように最適化される。この代わりに、パルス位
置を、ソース信号と量子化されたパルス列との知覚的に
重み付けされた2乗平均誤差を最小化するように最適化
することもできる。パルス位置の最適化は、コードブッ
クテーブルサーチと呼ばれる。
【0025】ここに開示する様々な実施形態によれば、
コードブックテーブルをサーチする単純化された方法が
提供される。これらの方法は、複数のパルスについての
コードブックサーチを、増加するパルス重要性から減少
するパルス重要性への順序で一度に1つのパルスについ
て実行される。ここで、パルスの重要性は、所定のパル
スがソース信号と量子化されたパルス列との2乗平均誤
差の最小化を提供する相対的な寄与として定義される。
【0026】図3は、この好ましい実施形態との組み合
わせで使用される許容テーブルを示すデータ構造図であ
る。許容テーブル300は、サンプル位置のそれぞれを
対応するイネーブル/ディスエーブルビットと関連づけ
る。サンプル位置4は、イネーブル/ディスエーブルビ
ット値1と関連づけられており、サンプル位置4をパル
スの可能性のある位置として有効にイネーブルする。サ
ンプル値5は、イネーブル/ディスエーブルビット値0
と関連づけられており、これはパルスがもはやこのサン
プル位置には付加され得ないことを意味する。
【0027】所定のサンプル位置は、任意の時点におい
てイネーブルまたはディスエーブルされる。コードブッ
クテーブルのサーチの間に、パルスを含むべきサンプル
位置が決定されるので、このサンプル位置に対するイネ
ーブル/ディスエーブルビットがセットされる。このイ
ネーブル/ディスエーブルビットは、具現化されるべき
制限に従ってセットされる。例えば、各水平行当たり1
つだけのパルスが許容されると仮定する。所定のコード
ブックサーチがサンプル位置9に−1のパルスが置かれ
るべきであると決定すると、許容テーブル300は、サ
ンプル位置9を含む水平行の全体についてゼロでロード
され、パルス配置のための可能性のある場所としてのさ
らなる考慮からこの行を取り除く。しかし、新たなコー
ドブックサーチが開始されると、許容テーブル全体が全
ての位置を1にセットすることにより初期化されて全て
の位置がイネーブルされる。
【0028】図4は、実際の知覚的重み付けフィルタの
構成についての例示的なフィルタ応答403を示す。パ
ルスの発生の後に、フィルタ出力の振幅がすぐにはゼロ
に戻らない。むしろ、受信したパルスの立ち下がり端が
終了した後に、フィルタ出力はリンギングし、即ち非ゼ
ロ応答を示す。
【0029】図5は、本発明の好ましい一実施形態によ
るコードブックテーブルの最適化方法を示すソフトウェ
アフローチャートである。このプログラムは、ブロック
501に置いて開始される。ブロック503に置いて、
コードブックテーブル200(図2)のコードブック構
成要素(サンプル位置)がクリアされ、許容テーブルが
全てのサンプルをイネーブルするようにセットされる。
このステップは、全てのサンプル位置をゼロにセットす
ることにより達成することができる。次のブロック50
5に置いて、この時点で全てのパルスがコードブックテ
ーブル200に付加されたかどうかを確かめるためのテ
ストが実行される。全てのパルスが付加されている場
合、プログラムは、ブロック511に進み、通常の音声
符号化システムの通常のコードブック刺激テーブル中の
エントリーが音声を合成するために使用される。
【0030】ブロック505からの否定的分岐はブロッ
ク507に導かれ、コードブックテーブル200に1つ
の最適なパルスを加えるためのサーチが実行される。こ
のサーチは、許容テーブル300中に示されたいかなる
制限にも従って実行することができるが、これは必ずし
も必要ではない。ブロック507において決定された選
択されたパルスは、ブロック509においてコードブッ
クテーブル200につけ加えられる。ブロック509に
おいて、許容テーブルが使用される場合、許容テーブル
はこの時点で更新される。そして、プログラムはブロッ
ク505に戻る。
【0031】
【発明の効果】以上説明したように、本発明によれば、
演算の負担を軽減しかつ従来の強引手法に近い正確さを
もつコードブックサーチ技術を提供することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態によるコードブックテーブ
ルのサーチ技術の全体的な動作環境を示すハードウェア
ブロック図
【図2】本発明の好ましい一実施形態との組み合わせで
使用されるコードブックテーブルの一例を示すデータ構
造図
【図3】本発明の好ましい一実施形態との組み合わせで
使用される許容テーブルの一例を示すデータ構造図
【図4】実際の知覚的重み付けフィルタの構成について
の典型的なフィルタ応答を示す図
【図5】本発明の好ましい一実施形態によるコードブッ
クテーブルの最適化方法を示すソフトウェアフローチャ
ート
【符号の説明】
100 音声信号源 101 音声コーダフロントエンド 102,121 加算回路 104 固定コードブック 106 可変遅延線 108 信号記憶バッファ 110 増幅器 112 知覚的重み付けフィルタ 113 量子化された残留信号の近似値 114 量子化された残留信号 115 誤差信号 116 以前の刺激の近似された残留信号 117 最適一致ベクトル 123 音声パラメータ 127 以前のフレームの量子化された残留信号の近似

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 複数のパルスを表すための複数のサンプ
    ル位置を有する固定コードブックを使用する音声符号化
    システムにおいて、個々のパルスの最適な位置を逐次決
    定することにより、複数のパルスについての最適な位置
    を決定することを特徴とする音声符号化システム。
  2. 【請求項2】 複数のパルスを表すための複数のサンプ
    ル位置を有する固定コードブックを使用する音声符号化
    システムにおいて、前記音声符号化システムの2乗平均
    誤差の決定に、各パルスの相対的な重要性に従って、個
    々のパルスの最適位置を逐次決定することにより、複数
    のパルスの最適な位置を決定することを特徴とする音声
    符号化システム。
  3. 【請求項3】 複数のパルスを表すための複数のサンプ
    ル位置を有する固定コードブックを使用する音声符号化
    システムにおいて、前記音声符号化システムの2乗平均
    誤差の決定に、各パルスの相対的な重要性に従って、個
    々のパルスの最適位置を逐次決定することにより、複数
    のパルスの最適な位置を決定し、サーチが、大きな相対
    的重要性を有するパルスから小さな相対的重要性を有す
    るパルスへ進められることを特徴とするシステム。
JP8153652A 1995-06-14 1996-06-14 音声符号化システム Pending JPH0926800A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US518354 1995-06-14
US08/518,354 US5822724A (en) 1995-06-14 1995-06-14 Optimized pulse location in codebook searching techniques for speech processing

Publications (1)

Publication Number Publication Date
JPH0926800A true JPH0926800A (ja) 1997-01-28

Family

ID=24063578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8153652A Pending JPH0926800A (ja) 1995-06-14 1996-06-14 音声符号化システム

Country Status (6)

Country Link
US (1) US5822724A (ja)
EP (1) EP0749111B1 (ja)
JP (1) JPH0926800A (ja)
KR (1) KR100371977B1 (ja)
CA (1) CA2175264C (ja)
DE (1) DE69612788T2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2254620A1 (en) * 1998-01-13 1999-07-13 Lucent Technologies Inc. Vocoder with efficient, fault tolerant excitation vector encoding
KR100576024B1 (ko) * 2000-04-12 2006-05-02 삼성전자주식회사 에이켈프 음성 압축기의 코드북 검색 장치 및 방법
US6847929B2 (en) * 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
KR100438175B1 (ko) * 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
JP4304360B2 (ja) * 2002-05-22 2009-07-29 日本電気株式会社 音声符号化復号方式間の符号変換方法および装置とその記憶媒体
KR100463419B1 (ko) * 2002-11-11 2004-12-23 한국전자통신연구원 적은 복잡도를 가진 고정 코드북 검색방법 및 장치
KR100503414B1 (ko) * 2002-11-14 2005-07-22 한국전자통신연구원 고정 코드북의 집중 검색 방법 및 장치
US20050256702A1 (en) * 2004-05-13 2005-11-17 Ittiam Systems (P) Ltd. Algebraic codebook search implementation on processors with multiple data paths
US7778472B2 (en) 2006-03-27 2010-08-17 Qualcomm Incorporated Methods and systems for significance coefficient coding in video compression
EP2009623A1 (en) * 2007-06-27 2008-12-31 Nokia Siemens Networks Oy Speech coding
CN100530357C (zh) * 2007-07-11 2009-08-19 华为技术有限公司 固定码书搜索方法及搜索器
CN100578619C (zh) * 2007-11-05 2010-01-06 华为技术有限公司 编码方法和编码器
GB2508417B (en) * 2012-11-30 2017-02-08 Toshiba Res Europe Ltd A speech processing system

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3624302A (en) * 1969-10-29 1971-11-30 Bell Telephone Labor Inc Speech analysis and synthesis by the use of the linear prediction of a speech wave
CA1223365A (en) * 1984-02-02 1987-06-23 Shigeru Ono Method and apparatus for speech coding
US4701954A (en) * 1984-03-16 1987-10-20 American Telephone And Telegraph Company, At&T Bell Laboratories Multipulse LPC speech processing arrangement
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
US5023910A (en) * 1988-04-08 1991-06-11 At&T Bell Laboratories Vector quantization in a harmonic speech coding arrangement
US4939061A (en) * 1989-05-25 1990-07-03 Xerox Corporation Toner compositions with negative charge enhancing additives
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
ES2093110T3 (es) * 1990-09-28 1996-12-16 Philips Electronics Nv Un metodo y un sistema para codificar señales analogicas.
FI98104C (fi) * 1991-05-20 1997-04-10 Nokia Mobile Phones Ltd Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi
US5265190A (en) * 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
US5179594A (en) * 1991-06-12 1993-01-12 Motorola, Inc. Efficient calculation of autocorrelation coefficients for CELP vocoder adaptive codebook
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
US5339384A (en) * 1992-02-18 1994-08-16 At&T Bell Laboratories Code-excited linear predictive coding with low delay for speech or audio signals
US5327520A (en) * 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
US5621852A (en) * 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss

Also Published As

Publication number Publication date
DE69612788T2 (de) 2001-11-22
EP0749111A2 (en) 1996-12-18
CA2175264C (en) 2001-01-02
CA2175264A1 (en) 1996-12-15
EP0749111B1 (en) 2001-05-16
KR970002849A (ko) 1997-01-28
US5822724A (en) 1998-10-13
DE69612788D1 (de) 2001-06-21
EP0749111A3 (en) 1998-05-13
KR100371977B1 (ko) 2003-04-07

Similar Documents

Publication Publication Date Title
US5265190A (en) CELP vocoder with efficient adaptive codebook search
RU2163399C2 (ru) Речевой кодер с линейным предсказанием и использованием анализа через синтез
AU656787B2 (en) Auditory model for parametrization of speech
US5187745A (en) Efficient codebook search for CELP vocoders
KR100310811B1 (ko) 정보 신호 코드화 방법 및 장치
JPH0926800A (ja) 音声符号化システム
KR950013372B1 (ko) 음성 부호화 장치와 그 방법
US5179594A (en) Efficient calculation of autocorrelation coefficients for CELP vocoder adaptive codebook
EP0824750B1 (en) A gain quantization method in analysis-by-synthesis linear predictive speech coding
EP0865029B1 (en) Efficient decomposition in noise and periodic signal waveforms in waveform interpolation
US5173941A (en) Reduced codebook search arrangement for CELP vocoders
EP0784846B1 (en) A multi-pulse analysis speech processing system and method
EP1513137A1 (en) Speech processing system and method with multi-pulse excitation
EP0516439A2 (en) Efficient CELP vocoder and method
US6397176B1 (en) Fixed codebook structure including sub-codebooks
EP0578436A1 (en) Selective application of speech coding techniques
US5822721A (en) Method and apparatus for fractal-excited linear predictive coding of digital signals
JP3147807B2 (ja) 信号符号化装置
US4962536A (en) Multi-pulse voice encoder with pitch prediction in a cross-correlation domain
US5854998A (en) Speech processing system quantizer of single-gain pulse excitation in speech coder
JPH05265495A (ja) 音声符号化装置並びにその分析器及び合成器
Kang et al. Improvement of the LPC analysis
JP4228630B2 (ja) 音声符号化装置および音声符号化プログラム
JP2001134298A (ja) 音声符号化装置と音声復号化装置、及び音声符号化復号化システム
JPH041800A (ja) 音声帯域信号符号化方法