JP2003122400A - 低ビットレートcelp符号化のための連続タイムワーピングに基づく信号の修正 - Google Patents

低ビットレートcelp符号化のための連続タイムワーピングに基づく信号の修正

Info

Publication number
JP2003122400A
JP2003122400A JP2002186971A JP2002186971A JP2003122400A JP 2003122400 A JP2003122400 A JP 2003122400A JP 2002186971 A JP2002186971 A JP 2002186971A JP 2002186971 A JP2002186971 A JP 2002186971A JP 2003122400 A JP2003122400 A JP 2003122400A
Authority
JP
Japan
Prior art keywords
residual
section
signal
lag
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002186971A
Other languages
English (en)
Other versions
JP2003122400A5 (ja
JP4162933B2 (ja
Inventor
Ajit V Rao
ブイ.ラオ アジット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2003122400A publication Critical patent/JP2003122400A/ja
Publication of JP2003122400A5 publication Critical patent/JP2003122400A5/ja
Application granted granted Critical
Publication of JP4162933B2 publication Critical patent/JP4162933B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Communication Control (AREA)

Abstract

(57)【要約】 【課題】 元の残差信号を理想化輪郭に一致するよう修
正するために、区分的な連続タイムワープ輪郭ではなく
連続タイムワープ輪郭を使用する信号修正技術により緻
密な音声符号化を容易化し、従来見られたエッジの影響
も回避すること。 【解決手段】 空間上で不連続のない、隣接フレーム内
の隣接端部の位置を反転させたり大幅に広げることのな
い連続ワープ輪郭を使用して、ワーピングを実施する。
ワープ輪郭によって実施される線形シフトが二次近似法
またはその他の方法によって導出されて符号化の複雑さ
が減少されるため、実際上経済的な実施が可能となる。
特に、ワープ輪郭を判断するためのアルゴリズムは、可
能な輪郭範囲のサブレンジ内に含まれている可能な輪郭
の1つのサブセットのみを使用する。これらの輪郭から
の相対相関強度が多項式トレース上の点としてモデル化
され、モデリング関数を最大にすることによって最適ワ
ープ輪郭が計算される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般に音声符号化
技法に関し、より詳細には、コードブック励起線形予測
(CELP、codebook excited li
near prediction)などの低ビットレー
ト符号化技術を介して信号を符号化する際の助けとな
る、信号を修正するための技法に関する。
【0002】
【従来の技術】今日の音声や対話の技術が高度に進んだ
環境下においては、ある地点から別の地点へ、時にはか
なり離れた距離間で、おまけにしばしば限られた帯域の
チャネルを介して、人間の声を電子的に伝送することが
必要または望ましい状況がたびたび起きる。例えば、現
在、セル式電話のリンクを介してまたはインターネット
またはその他のデジタル電子ネットワークを介しての会
話が普通のこととなっている。同様に、コンピュータの
ハードディスク上またはデジタル記録装置の揮発性また
は不揮発性メモリ内などに、人間の声をデジタル方式で
ストアすると便利なことがたびたびある。例えば、デジ
タル方式でストアした人間の声を、電話応答プロトコル
または音声によるプレゼンテーションの一部として再生
できる。
【0003】デジタル音声の伝送および/またはストア
に使用できるチャネルおよび媒体が限られた容量しか有
さないことが多く、この状況は日に日に増加の一途を辿
っている。例えば、リアルタイムの音声または録音され
た音声とともに使用される高品質ビデオの到来によっ
て、全部をストリーミングフォーマットで受信したりス
トアするためにダウンロードすることが可能なものな
ど、リアルタイムでのデジタルネットワークを介する電
話/テレビ会議やリアルタイムではない高品質の音声/
映像プレゼンテーションに対する需要が生み出されてき
た。映像の内容により様々な伝送チャネルおよび記憶媒
体内の帯域や記憶容量が変位するため、音声および映像
の両方を効率的に、かつ適切に圧縮することが緊急課題
となっている。また別のシナリオでは、音声の極端な、
かつ効果的な圧縮の必要性も増してきている。例えば、
ますます輻輳の度合いが増しているセル式電話のリンク
では、チャネルを介してより多くのユーザを取り扱うこ
とができなければならないが、多数のユーザを取り扱う
ためのチャネルの容量が変っていない。
【0004】動機はどうあれ、音声の圧縮が通信技術の
重要な分野になってきている。使用可能なデジタル音声
符号化技術は、圧縮を用いない非効率的な技術から圧縮
率4倍以上を達成する効率的な技術へと、その範囲が広
がってきている。一般に、既存の符号器は、波形符号器
か音声符号器のどちらかに分類できる。波形符号器は、
実際音声波自体を表そうとしており、通常高い圧縮率は
得られない。音声符号器、またはボコーダは、単に合成
された音声波をマップしようとするのではなく、人間の
音声の源および癖を対象としており、したがって計算の
複雑さが増しはするもののより高い圧縮率が得られるよ
うになる。波形符号器は、一般に、癖のある人間の声、
非言語音、高レベルの背景雑音に対して、より頑強であ
る。
【0005】広く使用されている多くの音声符号器は、
線形予測符号化に基づいた技術を使っている。この線形
予測符号化技術は、音声信号の各部分について、特定の
信号によって励起した場合、元の音声信号部分によく似
た信号を生成するデジタルフィルタが存在することを想
定している。特に、線形予測技術を実施している符号器
は、通常まず音声信号のスペクトル包絡線またはフォル
マントを示す一組の係数を導出する。これらの係数に対
応するフィルタが確立され、入力音声信号を予測残差に
減らすため使用される。一般に、上述のフィルタは逆合
成フィルタで、残差信号を対応する合成フィルタに入力
することにより、元の音声信号に極めて近い信号を生成
する。
【0006】通常、フィルタ係数および残差は、音声信
号を後におよび/または遠隔で再合成するために、伝送
またはストアされる。フィルタ係数は、少ないストアス
ペースや、例えば1.5kbpsの狭い伝送処理帯域し
か必要としないが、予測残差は、複雑さの点で元の音声
信号と似た高帯域信号である。したがって、音声信号を
効果的に圧縮するためには、予測残差を圧縮する必要が
ある。この圧縮を得るために、コードブック励起線形予
測、CELPの技術が使用される。CELPは、特定の
ベクトルを選択するために使用できる、それぞれが「コ
ードブック」一組からなる、1つ以上のコードブックイ
ンデックスを利用している。各コードブックはベクトル
の集合である。選択ベクトルは、基準化され合計される
と、フィルタの応答を残差自体に最も近づける合成フィ
ルタからの応答を生成するよう選ばれる。CELP復号
器はCELP符号器がアクセスしたのと同じコードブッ
クにアクセスし、したがって符号器コードブックおよび
復号器コードブックからの同じベクトルを確認するた
め、簡単なインデックスが使用できる。
【0007】容量または帯域が十分に使用可能な場合
は、たとえどんなに複雑であろうとも、元の残差の最良
近似を十分に行うことのできるコードブックを有するこ
とは困難ではない。しかし、使用可能な容量または帯域
が減少してくると、当然CELPコードブックの能力も
減少する。
【0008】残差信号を模倣するのに必要なビット数を
減少させるための1方法は、その周期性を増加すること
である。つまり、元の信号の重複した部分を重複しない
機能より、よりコンパクトに表わすことができるように
するということである。この原理を利用している1技術
に、RCELP(Relaxation Codebo
ok Excited Linear Predict
ive coding)がある。この技術の一例が、
W.B.Kleijnらによる文献「The RCEL
P Speech coding Algorithm
(RCELP音声符号化アルゴリズム)、Eur.Tr
ans.On Communications、vo
l.4、no.5、pp.573−82(1994年)
であり、これは開示されている全部を参照により本明細
書に組み入れてある。特に、この文献は、修正されたピ
ッチ周期の輪郭が合成ピッチ周期の輪郭と一致するよう
に、残差信号の全セグメントを均一に進めるまたは遅ら
せる方法について記載している。この方法の問題点は、
特定のワーピング方法のアーティファクトとして、元の
信号の特定部分が削除されたり繰り返されたりする可能
性があることである。特に、ある信号の2つの隣接する
セグメントが累積圧縮シフトする場合、オーバーラップ
部分の近くの元の信号の一部が、修正後の信号内で削除
されてしまう可能性がある。同様に、2つの隣接するセ
グメントが累積拡張シフトする場合、オーバーラップ部
分の近くの元の信号の一部が、修正信号内で繰り返され
てしまう可能性がある。これらのアーティファクトが、
最終的に再生される音声内で可聴ひずみを生成する。
【0009】別の技術でも同様の方法が提案されてい
る。例えば、W.B.Kleijnらによる文献「合成
による分析音声符号器におけるピッチ予測子パラメータ
の補間(Interpolation of the
Pitch−Predictor parameter
s in Analysis−by−Synthesi
s Speech Coders)」、音声処理のIE
EEトランザクション(IEEE Transacti
ons of Speech and Audio P
rocessing、vol.2、no.1、part
I(1994年1月)を参照されたい。これは開示され
ている全部を参照により本明細書に組み入れてある。
【0010】過去に提案されたピッチワーピング方法は
すべて、セグメントエッジのシフトによる品質低下な
ど、同じような欠点を有しており、この欠点により元の
信号の削除や繰り返しが起きていた。音声信号用の伝送
ビットレートを減少させるが、信号の繰り返しや削除が
起きず、またリアルタイムの通信が不可能となる程度に
まで符号化計算を複雑にしたり遅延させたりしないよう
なフレームワーピング方法を提供することが望ましい。
【0011】
【発明が解決しようとする課題】本発明は、元の残差信
号を合成輪郭と一致するよう修正するために、従来の技
術によく見られるエッジシフトの影響を避けることがで
きる、単に区分的連続タイムワープ輪郭ではない連続タ
イムワープ輪郭を用いる。特に、本発明で用いられるワ
ープ輪郭は連続ワープ輪郭である。すなわち空間ジャン
プや不連続がなく、そして隣接フレーム内の隣接端の位
置を反転したりまたは過度に広げたりしない。
【0012】符号化アルゴリズムの複雑さを減少して実
際上のおよび経済的な実施を可能にするために、最適線
形シフトを二次またはその他の近似を使用して導出す
る。特に、理想化ワープ輪郭を判断するため本発明で利
用するアルゴリズムでは、修正信号を合成信号に相互関
連させるために、可能性のあるすべてのワープ輪郭を計
算し利用する必要がない。一実施形態では、可能な輪郭
のサブレンジ全体からの可能な輪郭のサブセットが計算
される。次いでこれらの輪郭からの相対相関強度が、二
次曲線またはその他のパラメトリック関数曲線上の点と
してモデル化される。次いで最適ワープ輪郭が、これは
恐らく計算されたサンプル点間のどこかに位置する1点
によって表されるが、適切なパラメトリック関数を最大
にすることによって計算される。二分法や区分的多項式
モデリングなどその他の単純化技術も、本発明で使用す
ることができる。
【0013】本発明の付加的な機能および利点について
は、以下に例として示す実施形態の詳細な説明および添
付図を参照すれば明らかとなるであろう。
【0014】
【課題を解決するための手段】以下の説明では、それ以
外のことを特筆していない限り、1つ以上のコンピュー
タによって実施されるオペレーションの動作および記号
表示を参照しながら本発明について記載する。したがっ
て、時折コンピュータ実行と呼ぶ、この動作(act
s)およびオペレーションには、構造化形式でデータを
表す電気信号のコンピュータの処理ユニットによる操作
が含まれることが理解できるであろう。この操作によ
り、コンピュータのメモリシステム内のいろいろな場所
でデータが変換または保持され、当業者に良く理解され
ている方式でコンピュータのオペレーションを再構成ま
たは変更する。データが保持されているデータ構造は、
そのデータのフォーマットによって定義された特定のプ
ロパティを有するメモリの物理領域である。しかし、本
発明を以下に記載していくが、以下に記載する様々な動
作およびオペレーションは、ハードウェア内でも実施可
能であり、限定的なものではないことが、当業者なら理
解できるであろう。
【0015】音声符号器は、高ビットレートの入力デジ
タル音声信号をより低いビットレート信号に圧縮し、次
いでデジタルチャネル、例えばインターネットを介して
伝送し、またはデジタルメモリモジュール、例えばハー
ドディスクやCD−R内にストアするよう動作が可能な
ソフトウェアモジュールである。伝送またはストアされ
たビットは、音声復号器によって復号化されたデジタル
音声信号に変換される。音声符号器および復号器を、2
つ合わせて音声コーデックと呼ぶことが多い。音声コー
デックは、特に入力信号が人間の声の場合に、入力音声
信号に最も近い可能な再構築を復号器で生成するよう設
計されている。音声符号化で使用される最も一般的なパ
ラダイムは、コードブック励起線形予測(CELP)で
ある。CELP音声符号器は、短期予測およびコードブ
ック探索の原理に基づいている。CELP符号化のコン
セプトおよび関数については、読者の理解の助けとなる
よう本明細書にて論じることとする。この論議は、当業
界で知られているものとは異なる方式でCELP符号化
を定義しようとするものではない。
【0016】どの音声符号器においても、人間の音声は
その性質上複雑でありまた時間につれて変化するもので
あり、それを捕らえるために使用可能なビット数が少な
いため、低ビットレートにおいて、そのタスクがますま
す困難かつ複雑になっている。本発明は、ストアまたは
伝送のために要するビット数がより少なくて済むよう
に、音声符号器によって入力デジタル音声信号を符号化
する前に、それを修正するための新規な方法を提供す
る。信号の修正の目的は、再構築される信号の知覚品質
に悪影響を及ぼさないで、入力音声信号の波形の構造を
単純化することである。信号の修正後、修正された入力
音声信号は、符号化するため音声符号器に表示される。
修正された波形構造が単純なため、音声符号器は、信号
符号化のタスクをより上手く、かつ効率的に実施するこ
とができる。上述したように、信号の修正は特に低いビ
ットレートで有利である。
【0017】本明細書に記載する信号修正技術は、連続
タイムワーピングのモデルに基づいている。上記のRC
ELPの信号修正技術とは異なり、連続タイムワーピン
グでは、単なる区分的連続輪郭ではなく連続ワーピング
輪郭を使用して、入力信号を修正する。その結果が、そ
の波形が単純な構造を有し、その品質が元の入力信号の
品質と実質的に同じである修正音声信号となる。
【0018】本発明を十分に理解するためには、コーデ
ック技術のCELPファミリの基本のファセットを理解
することが重要である。当業者には様々なCELP技術
が周知であるが、読者の便宜のため本明細書に簡単に記
載することとする。CELP符号化においては、復号化
された音声信号が、時間によって変化する合成フィルタ
を通して励起信号をフィルタリングすることによって生
成される。符号器が励起信号および合成フィルタについ
ての情報を復号器に送信する。
【0019】CELPとは波形を一致させる方法であ
る。すなわち、提案された合成信号の、残差などのモデ
ル化すべき信号との相関を介して、励起信号の選択を最
適化する。したがって、符号器は入力音声信号の短いセ
グメントを評価し、各セグメントについて最も近いレプ
リカの生成を試みる。特に、符号器は、まず「コードベ
クトル」と呼ぶ特定の許容信号を組み合わせることによ
って一組の励起信号を生成する。このようにして生成さ
れた一組内の各励起信号は、合成フィルタを通して通過
され、元の音声信号に最も近い、またはレプリカとして
複製されるべき別の信号を生成するフィルタリングされ
た励起信号が選択される。このような探索手順に従っ
て、符号器は、選択された励起信号を生成するため組み
合わされたコードベクトルについての情報と合成フィル
タについての情報を復号器に送信する。通常、大部分の
ビットが、合成フィルタ励起信号の形成のためのコード
ベクトルについての情報を送信するのに必要であるが、
合成フィルタパラメータ自体に必要なビット数は通常
1.5kb/s未満である。したがって、CELPは、
例えば入力音声信号の複雑な性質を表すのに十分なコー
ドベクトルのある、4kbpsを越える比較的高いビッ
トレートで良く機能する。低いビットレートでは、許容
コードベクトルの数が少ないため、再生される信号品質
がかなり低下する。
【0020】音声の知覚的に重要な有声セグメントのた
めの残差信号の主要特性は、おおよそ周期的なスパイク
のシーケンスである。これらのスパイクは一般に、ピッ
チ周期で分けられて、大体均一に間隔をあけているが、
これらスパイクの位置の規則性の点で小さなジッタのあ
ることが多い。これらのジッタは、知覚的には重要では
ないものの、低ビットレートの波形符号器の限られたビ
ット数の大部分を消費する。
【0021】既に論じたように、RCELPは、スパイ
クの場所を再調整して定期的に起きるようにするため残
差信号を非連続的にワーピングすることにより、この変
化を除去するよう試みていた。修正信号内のスパイクの
場所についての情報を送信するのに必要なビット数が非
常に少なくて済むため、この方式による信号の修正は、
低ビットレートの符号器のタスクを軽減する。残差修正
の後、この修正信号は、予測フィルタの反転を通じて通
過させることにより、音声領域内に変換し直される。
【0022】しかし、RCELPによる信号修正によ
り、使用されたワーピング関数のプロパティが最適とは
言えないため、音声品質が知覚的に劣化する。特に、R
CELPにおいては、それぞれが単一のスパイクを含
む、元の残差信号のオーバーラップしている可能性のあ
る部分が、修正残差信号を生成するためカットされおよ
び一列に繋がってしまうこととなる。このカットされた
部分がオーバーラップする可能性があり、また実際オー
バーラップすることが多いため、残差信号の一部が修正
残差信号に2度現れたり、また他の部分は1度も現れな
くなったりする。
【0023】本発明は、改良されたワープ輪郭最適化方
法を用いた本発明の一実施形態とともに、連続タイムワ
ーピングアルゴリズムを利用することによって、上述の
RCELP残差修正手順における望ましくないプロパテ
ィを克服している。要するに、本発明によるアルゴリズ
ムは、まずRCELPと同様に、単一スパイクを含む元
の残差信号の各部分を確認する。しかし、RCELPと
は異なり、これらの部分はオーバーラップしておらずフ
レーム全体を覆っている。つまり、カットされた部分が
連結している場合でも、元の残差信号が得られ、残差信
号の一部が2度現れたり、一部が削除されたりしなくな
る。
【0024】本来、RCELPでのように部分を単にカ
ットしたり動かしたりするのではなく、このアルゴリズ
ムは、連続的および適応的タイムワーピングオペレーシ
ョンにおいて、各部分を線形加速したり線形減速したり
する。各部分をワープする目的は、修正残差信号内のス
パイクが定間隔で分離され、それによってスパイクの位
置を符号化するのに要するビットレートが減少し、RC
ELPと同様の目標を達成し、しかも欠点がないことを
確認することにある。後述するように、再生される音声
の品質の低下を回避するため、加速または遅延の程度が
制限されている。
【0025】添付の特許請求の範囲は本発明の特徴を詳
細に記載しているが、本発明は、その目的および利点と
ともに、以下の詳細な説明と添付の図面から良く理解さ
れるであろう。
【0026】
【発明の実施の形態】本発明の一般的な側面については
上述したが、好ましい実施形態の詳細について、以下に
さらに詳しく述べることとする。図1を参照すると、本
発明の一実施形態による改良された低ビットレートの符
号器を実施するためのアーキテクチャを例示してある。
このシステムは、すべてカスケードにつないだ、ディジ
タイザ121と、予測フィルタまたは逆合成フィルタ1
01と、線形連続残差修正モジュール103と、合成フ
ィルタ105と、CELP符号器107などの符号器と
を備える。
【0027】予測フィルタ101は、デジタル化した音
声信号109をディジタイザモジュール121から入力
として受信する。どの音声をデジタル電気信号に変換す
るかについては様々な方法があり、当業者には周知であ
る。したがって、このような技術については本明細書で
は詳細に論じないこととする。予測フィルタ101はま
た、逆合成フィルタと呼ぶ場合があるが、LPC係数お
よび入力信号に基づいて残差信号111を生成するよう
動作可能である。逆フィルタおよび残差などの線形予測
符号化コンセプトについては、当業者は精通されている
ことであろう。残差111は、残差修正モジュール10
3に入力され、以下に詳細に論じる方式で、その信号を
修正残差113に変換する。修正残差113は、その後
合成フィルタ105に入力され、再生音声信号115を
生成する。残差修正モジュール103によって実施され
る残差修正技術によって、励起または修正残差113が
残差111から変化しているにもかかわらず、修正音声
信号115が元の信号109と非常に似た音を発する。
その後、CELP符号器モジュール107が、当業者に
良く理解されている方式で、修正音声信号を符号化し、
伝送またはストアするために符号化したビット117の
ストリームを出力する。
【0028】図1に示すモジュールのオペレーション
を、図2および図3、図4を参照しながら、以下に詳細
に記載する。特に、図2は、顕著なピッチピーク201
を有する単純化された波形203、205、207、2
09、211を示す。図2に示すピークのシフトを、理
解しやすいように誇張してあることに留意されたい。実
際のシフト量を制限する必要があるが、このことについ
ては後に論じる。図3および図4は、音声信号を符号化
するため、本発明の一実施形態で実施するステップを示
す流れ図である。ステップ301では、アナログ音声信
号119がディジタイザ121によって受信される。ス
テップ303では、ディジタイザ121が、8kHzで
信号をサンプリングし、そのサンプリングしたデジタル
音声信号s(n)を得る。その後、ステップ305で
は、信号s(n)はディジタイザによって160サンプ
ル(20ms)の長さのオーバーラップしていないフレ
ームにグループ化され、そのそれぞれがさらに80サン
プル(10ms)の長さの2つのオーバーラップしてい
ないサブフレームに細別される。したがって、K番目の
フレーム内の信号が、s(160k)...s(160
k+159)によって与えられる。ステップ307で、
フレームされサンプリングされた信号109が、ディジ
タイザ121からLPC抽出装置123に送られる。
【0029】LPC抽出装置123は、当業者に周知の
方式で入力信号に対応する線形予測係数を計算するよう
動作する。特にステップ309では、LPC抽出装置1
23は、相関分析を実施しレビンソン−ダービン(Le
vinson−Durbin)アルゴリズムを実行する
ことにより、各フレームのための一組の10次程度(t
enth order)の線形予測係数を抽出する。K
番目のフレームa(j)、j=1,...,10内の
最適線形予測係数は、ステップ311で補間され、各サ
ブフレーム内で一組のLP係数aks(j)、j=
1,...,10を生成する。上式で、s=0、1は、
それぞれ第1のサブフレーム、第2のサブフレームに対
応する。この補間は、LP係数をラインスペクトル周波
数(LSF)領域内に変換し、LSF領域へ線形補間
し、その補間したサブフレームLSF係数をLP係数に
変換し直すことによって実施できる。ステップ313で
は、サブフレームLP係数aksは、予測フィルタ10
1によって使用され、当業者に周知の方式で残差信号1
11を生成する。K番目のフレーム内の残差111は、
r(n)、n=160k...160k+159で表さ
れる。
【0030】残差信号111の顕著な特性を、図2に波
形203で示す。特に、有声セグメントについては、大
体周期的だが不規則に配置されているピークまたはスパ
イク201のシーケンスによって、残差203が優勢と
なっている。これらのスパイクは、通常有声音声の生成
の過程中に、音域を励起する声門音の振動(pulse
s)を表す。隣接スパイク間の時間間隔は、ピッチ周期
に等しい。人間の音声は、通常約2.5msから18.
5msの間のピッチ周期を有する。スパイク間の間隔は
普通一定ではなく、小さい不規則性またはジッタを示
す。
【0031】ステップ315から333では、残差修正
モジュール103のオペレーションについて記載する。
ステップ315では、残差修正モジュール103が残差
信号111を受信し、現在のフレーム、つまりk番目の
フレームの整数ピッチ周期を判断する。このピッチ周期
は、当業界で周知の技術の中のいずれかによって判断で
きる。本実施形態において使用可能な1つの技術は、オ
ープンループ内で相関分析を用いるものである。どのよ
うな方法を使用するにしても、ピッチが倍加(pitc
h doubling)するなどの望ましくないアーテ
ィファクトを避けるため、十分な注意を払う必要があ
る。
【0032】ステップ317では、フレームピッチ周期
のサンプル線形補間によるサンプリングを、以下のよう
に実施する。 c′(n)=p(k)((n−160k)/160)
+p(k−1)(1−(n−160k)/160),
n=160k...160k+159 関数c′(n)は、フレームの開始点でのp(k−1)
からフレームの終点でのp(k)までの直線として表さ
れる。これは、現在のフレーム内のすべてのサンプルに
対する滑らかに変化するピッチ周期(浮動小数点)を表
す。
【0033】ステップ319では、関数c(n)は、
c′(n)の各値を0.125に最も近い倍数に丸める
ことによって形成される。実際、c(n)は1/8の倍
数であり、したがって8c(n)は8倍にオーバーサ
ンプリングされた信号領域内の整数ピッチ周期である。
本明細書では、c(n)を望ましいピッチ輪郭と呼ぶ。
この理想化輪郭に一致するため残差を修正することによ
って生じた効率の良さには著しいものがある。例えば、
このような輪郭を有するフレームのピッチ周期は、非常
に少ないビット数を使用して伝送でき、また復号器がピ
ッチ輪郭を導出するためピッチを使用することができ、
次いで現在のフレームのためのピッチスパイクの場所を
推定するために、前のフレームからのスパイクの場所と
ともにピッチ輪郭を使用することができる。
【0034】つぎのプロセスは、復号器を模倣して、前
のフレームのピッチ輪郭および修正残差に基づいて現在
のフレーム残差内でスパイクの場所の再構築を試みるこ
とである。実際の復号器は、通常前のフレームの修正残
差についての情報にアクセスしないが、前のフレームを
再構築するために使用される励起信号にアクセスする。
したがって、特定のフレームの励起信号内のスパイク
が、そのフレームの修正残差内のスパイクと位置を合わ
せるので、前の励起信号には復号器を使用し、前の修正
残差には符号器を使用することが問題とはならない。
【0035】現在のフレーム内のスパイクの位置を予測
するために、残差修正モジュール103が、ピッチ輪郭
を使ってステップ321内にある前のフレームの修正残
差を遅らせ、修正のためのターゲット信号r(n)を
生成する。例示したr(n)の波形が、図2の要素2
11に示してある。このタイムワーピング関数は、ピッ
チ輪郭c(n)が0.125の倍数であるため、切り捨
てsinc(x)インパルス応答および90%通過帯域
を有する標準補間フィルタを使用して、8倍オーバーサ
ンプリングした領域内で動作する。特に、8倍オーバー
サンプリングは、前のフレーム内の修正残差r′(n)
の補間されたサンプルを得るため用いられ、以下のよう
なオーバーサンプリングした信号に到達する。 r″(n0.125),n=160(k−
1)...160(k−1)+1279 r″のサンプルインデックスは0.125の倍数であ
り、オーバーサンプリングした状態を表している。次い
で、ターゲット信号r(n)を得るため、以下のよう
に遅延線オペレーションを実行する。 r(n0.125)=rd(n0.125)n=
160(k−1)...160(k−1)
+1279 r(n0.125)=r(n0.125−C
(INT(n0.125))),n=160
k...160k+1279 r(n)=r(n),n=160k...160
k+159 上式で、INT(x)は、x、浮動小数点数に最も近い
整数を表し、r()は、中間信号を表す。
【0036】復号器が、前のフレームの励起信号上で同
じ遅延線オペレーションを実行することに留意された
い。
【0037】ターゲット信号211内に表されている理
想化ピッチスパイクの場所を計算した後、符号器は次い
で、実際の残差内のスパイクを、r(n)内のスパイ
クと一致させるため再配置できる。最初にステップ32
3で、残差修正モジュール103が、未修正残差信号2
03を分析し、低エネルギ領域によって取り囲まれてい
る1つの顕著なピークを有する信号の明確なセグメント
を確認する。図2の要素205に、結果として生じる波
形が例示してある。セグメントに分割された、信号の部
分間には隙間のないことが好ましい。言い換えれば、要
素205の部分どうしがこの段階で再び一列に繋がる場
合、その結果未修正残差203が生じる。好ましくは、
この残差203は知覚的に見て目立たない程度に低いエ
ネルギ点でのみカットされる。次いでステップ325
で、符号器がターゲット信号の1セクションを未修正残
差の適切な部分に関連付ける。
【0038】ステップ327で、最適なワーピング関数
を用いた修正によって、残差203のセグメント内の顕
著なスパイクまたはピークが、ターゲット信号211の
関連セクション内の顕著なスパイクまたはピークに位置
合わせするよう、残差修正モジュール103が、未修正
残差の確認されたセクションのための最適ワーピング関
数を計算する。図5を参照すると、残差の各セクション
のための最適ワーピング関数を計算するためにとったス
テップが例として示してある。特に図5は、残差信号2
03と修正残差209間のサンプル毎の遅延を表すラグ
(lag)輪郭l(n)の導出を示す。量l(n)は、
修正残差サンプルr′(m)がオーバーサンプリングさ
れた領域内でl(m)によって遅延される残差信号サン
プルと等しくなるような、0.125の倍数である。つ
まり、 r′(m)=r″(m−l(m)) 最適ワープ輪郭を見つけ出す場合の問題は、最適ラグ輪
郭l(n)を見つけ出す問題に減じる。
【0039】ステップ401では、現在の当該セクショ
ンの一番最初のサンプル用のラグl が、前のセクショ
ンの一番最後のサンプル用のラグと等しいように設定さ
れ、現在のセクションの最後のサンプルのラグl用の
一組の候補が確認される。特に、最後のサンプルのラグ
用の一組の2K+1候補が、{l−K,l−K
+1,...l+K}などの候補範囲内で確認され
る。Kの値は、使用可能な計算能力、音声サンプルの周
期性、lの値などのパラメータに基づいて選択され
る。Kの典型的な値は、0、1、2、3、または4であ
る。上記の方程式で示す候補範囲はlの周りに対称的
に入っているが、必ずしもこのようである必要はない。
【0040】残差の少量シフトセクションが、再生され
た信号の知覚品質に悪影響を与えることはないが、シフ
ト量が大きい場合は知覚的に悪影響となる可能性があ
る。したがって、前のセクションまたは部分がシフトし
た結果、累積されたシフトを含む3つの元の(オーバー
サンプリングされていない)サンプル増分など、少量だ
けサンプルがシフトするように量を制限することが望ま
しい。したがって、2つのサンプル位置の均等物によっ
て、前の部分内の最後のサンプルが遅延した場合は、次
いで現在の部分の最後のサンプルは、1つのサンプル位
置の均等物を越えてさらに遅延してはならない。さもな
いと、全シフト量が元の場所から3つのサンプル位置を
越えることとなる。この問題点に対する解決法は、シフ
トが望ましい範囲を越えないようにKの値を制限する
か、または候補の非対称範囲を使用するかのどちらかで
ある。したがって、上記の例においては、1つのサンプ
ルを越える遅延は禁じられているが、非対称的に分布し
ている候補ラグ値が使われている場合は、5つのサンプ
ル位置の加速が認められる。
【0041】可能性のあるすべてのラグ候補を評価する
のに必要な計算能力が押さえられているため、候補の組
内には可能性のあるすべてのラグ候補よりも少数のラグ
候補しかないことに留意されたい。逆に、現在のセクシ
ョン内の最後のサンプル用に可能なラグ値のサブセット
のみが候補として使用される。候補範囲外のラグ値はこ
の組内に含まれておらず、また候補ラグ値間にある値も
同様である。したがって、最後のサンプル用の最適ラグ
値(および結果として生じるラグ輪郭)が、候補の組自
体内に含まれてもいない可能性があるが、候補範囲内に
入っていることが好ましい。
【0042】次いで、ステップ403では、一組の2K
+1候補ラグ輪郭を生成するため、符号器が、ステップ
401で確認した各候補ラグ値用の現在のセクションの
最初と最後のサンプル間の線形補間を実施する。候補ラ
グ輪郭は、最初と最後の値がそれぞれ1、lである
線形関数を表している。ここで、lとは候補値であ
る。ステップ405では、一組の2K+1候補修正残差
を得るために、各候補ラグ輪郭が残差信号に適用され、
ターゲット信号r(n)211と各候補修正残差の間
の相関が、ステップ407で計算される。
【0043】ステップ409では、相関強度が最後のサ
ンプルラグ値に応じて二次方程式でモデル化され、最後
のサンプル用の最適ラグ値が得られる。特に、各候補修
正残差用の相関強度が、図6のグラフ内のプロット点で
示すように、関連する最後のサンプルラグ値候補に応じ
てプロットされる。次いで、そのプロット点が組に分割
され、それぞれの組は3点から構成される。隣接する組
間に1点のオーバーラップがある。したがって、2K+
1プロット点はこのようにKに分割され、それぞれ3点
の組とオーバーラップする。例えば、7点については3
組となる。3つの連続するプロット点の各組は、二次関
数に従ってモデル化される。例えば図6では、3つの二
次モデリング関数が501、503、505として例示
してある。関連する3点の最初から最後までの範囲内の
各二次関数の最大が得られ、次いでセクション全体の最
大が計算される。したがって、正の二次関数、すなわち
上向きにくぼんだところ、および点の単調構成について
は、最大相関値が終点の1つに位置する。一般に、所与
の3点の組の最大が必ずしもこの3点のいずれかに位置
するとは限らないが、この間のどこかに位置することが
多いことに留意されたい。したがって、セクション全体
のための最適ラグ値は、ラグl用の候補の組内に入っ
ていない値である可能性がある。
【0044】図6のプロットは、本発明の一実施形態に
よるステップをグラフで示すため使用しているが、本明
細書で使用する用語、「プロット」または「プロッティ
ング」では、具体的または目に見えるグラフを作成する
必要はない。逆に、これらの用語は、単に量と量との間
の関連の創出を暗黙に定義するにすぎない。黙示的なも
のとしては、使用されている軸が、図6に示す量に対す
るそれぞれ異なるパラメータであり、明示的なおよび実
際のものとしては、グラフィカルプログラムデータ構造
の中にあり、また仮想的なものとしては、適切な関係が
導出できるメモリ内の一組の数の中にある。したがっ
て、たとえこのような関係が明確であろうとも、これら
の用語は、単に表示した量と量との間の関係の創出を表
わすにすぎない。
【0045】現在の相関プロット用のすべての二次方程
式の最大は、適切な二次方程式を用いた最後のサンプル
用のラグ値に関連付けられており、この値が最適な最後
のサンプルラグ値である。点の組をモデル化するために
二次関数を使用したり、3点を使用したりする必要はな
い。例えば、これらの組は3点を超える量を含むことが
でき、モデリング関数は、受容可能な複雑さのレベルに
応じて、どの程度の多項式にもなる可能性がある。点の
単調シーケンスについては、一番高い終点が簡単に判断
でき、シーケンスの最大を表すため、そのシーケンスを
多項式などでモデル化する必要はないことにも留意され
たい。
【0046】現在の顕著なピーク含有セクションまたは
セグメントの最後のサンプル用の最適ラグ値を判断した
後、残差修正モジュール103が、ステップ411で、
からステップ409で計算した最適lまでのセク
ション全体を線形に補間することによって、対応するラ
グ輪郭を導出する。図4のステップ329では、図5の
ステップ411で計算されたラグ輪郭が、上記のように
残差に適用される。すなわち、r′(n)=r″(n−
l(n))。
【0047】最後に、ステップ331では、現在のフレ
ーム内に分析しシフトすべき部分がこれ以上ないかどう
か判断する。もしあれば、オペレーションのフローがス
テップ325に戻る。そうでない場合は、現在のフレー
ムのためのプロセスは、ステップ333で終了する。図
2の要素207には、修正残差209のワープされたセ
クションが、理解しやすいように別に示してある。波形
209として示した修正残差113は、最後に合成フィ
ルタ105への入力として設けられ、元の音声信号の再
生を行う。この再生はジッタのあるピッチピークよりむ
しろ規則的なピッチピークを有する。この観点から、信
号は、通常のCELPなどの技術を使用して処理され
る。しかし、ピッチ構造の周期性が増すため、未修正信
号を符号化するのに必要なビットレートと比べて、信号
を符号化するのに必要なビットレートが大幅に減少す
る。
【0048】フレームを処理した後、後続するフレーム
に対して処理が開始される。無声のセグメントの場合
は、通常ピッチピークがなく、したがって本明細書に記
載した方法を適用する必要はない。無声の間隔の間は、
アルゴリズム内のすべての量がリセットされる。例え
ば、累積シフトの表示がゼロにリセットされる。有声の
通話が開始されたら、最初の有声フレームkは、前のフ
レームのピッチ値、p(k−1)がこのフレーム内で知
られていないため、特別なケースとして扱われる。この
特別フレームkのピッチ輪郭は、フレームのピッチ値、
p(k)に等しい一定の関数に設定される。この手順の
これ以降の部分は、規則的なフレームのものと同様であ
る。
【0049】現在のフレーム内の音声信号の所与のセク
ションまたは部分用の最適ラグ値l および関連ラグ輪
郭を計算するために、多項式モデリング以外の方法も本
発明に使用できることに留意されたい。可能なラグ値の
実質的なサブセット、例えば可能性のあるすべてのラグ
値の半分が相関値を生成するために使用されることが本
発明には重要なことである。なぜなら、このことによっ
て、最適ラグ輪郭を見つけ出すのに要する計算コストが
大幅に減少するからである。したがって、すべての、ま
たは大部分の可能なラグ値を試みることなく、最適ラグ
値を見つけ出すのに、二分法などの代替技術を使用する
ことができる。二分法技術では、2つのラグ候補値およ
びそれらの関連相関強度を確認する必要がある。より高
い相関を有するラグ候補および2つのラグ値間にある新
しいラグ候補が、二分法プロセスを繰り返すための終点
として使用される。このプロセスは、所定の回数を繰り
返した後、または所定の閾値を越える相関強度を有する
ラグ値が見つかった時に、終了することができる。
【0050】本明細書に記載した方法によって生じる連
続線形ワープ輪郭が、図7に示してある。特に、連続線
形ワープ輪郭601は黒い実線で示してあり、また従来
の技術RCELP技術で使用される不連続輪郭603は
破線で示してある。両輪郭とも、元の時間(ワープ前)
対修正時間(ワープ後)に応じてプロットされた信号サ
ンプルのための点の組に沿って引いた線で表す。したが
って、輪郭601内の各直線セグメントおよび輪郭60
3の各個々の部分は、それぞれの技術に従ってワープさ
れた元の残差のセクションを表す。RCELP技術で
は、よくセクションが削除されたりオーバーラップする
ことが分かる。一方、本発明の連続線形ワープ輪郭で
は、オーバーラップや削除は起こらない。逆に、連続線
形ワープ輪郭601は、傾斜の点で不連続を含むが、位
置の点では単なる区分的な連続ではない連続である。特
に、領域605は、ワープ輪郭603の2つの部分によ
って占有されているが、セクション607は同じ輪郭に
ついてのデータを有さない。一方、信号スペース全体
は、本発明による輪郭601によってオーバーラップや
削除もなく占有されている。
【0051】隣接セグメント用のワープ輪郭601は、
各セグメントに必要な加速または減速に応じて、同じ傾
斜または異なる傾斜を有する可能性があることに留意さ
れたい。これと対称的に、RCELP輪郭603の各セ
クションの傾斜は、一定である。これは、RCELPは
信号のセクションをシフトするが、各セクション内の時
間変換係数(time scale)を変化させないこ
とによる。したがって、本発明による方法は、セクショ
ンエッジで望ましくない時間変換係数の不連続を生成す
ることなく、各セクションのピークが望ましい場所にシ
フトするように、線形連続方式で各セクション内で時間
変換係数をワープすることが分かる。
【0052】必ずしも必要ではないが、コンピュータで
実行するプログラム「モジュール」などの命令を使用し
て、本発明を実施することができる。一般に、プログラ
ムモジュールは、特定のタスクを実行しまたは特定の抽
象データタイプを実施するルーチン、オブジェクト、構
成要素、データ構造などを含む。プログラムは、1つ以
上のプログラムモジュールを含むことができる。
【0053】本発明は、セル式電話、パーソナルコンピ
ュータ(PC)、ハンドヘルド装置、マルチプロセッサ
システム、マイクロプロセッサベースのプログラム可能
な民生用電子機器、ネットワークPC、ミニコンピュー
タ、メインフレームコンピュータなどを含む様々なタイ
プの機械、または本明細書に記載したように音声信号を
符号化または復号化し、信号をストア、検索、送信、受
信するために使用できるその他の機械で実施できる。本
発明は、タスクが、通信ネットワークを通してリンクさ
れている遠隔構成要素によって実行される、分散型コン
ピューティングシステム内で用いることができる。
【0054】図8に、本発明の一実施形態を実施するた
めのシステムを例として示すが、これには、コンピュー
タ装置700などのコンピュータ装置が含まれる。最も
基本的な構成では、コンピュータ装置700は、通常少
なくとも1つの処理ユニット702およびメモリ704
を備える。コンピュータ装置の正確な構成およびタイプ
によって、メモリ704は、(RAMなどの)揮発性、
(ROM、フラッシュメモリなどの)不揮発性、または
これら2つの組み合わせとなる。この最も基本的な構成
は、図8の線706内に示す。さらに、コンピュータ装
置700には、追加の特徴/機能も有することができ
る。例えば、コンピュータ装置700に、磁気または光
のディスクやテープを含む追加記憶装置(取外し可能お
よび/または取外し不可能)も備えることができるが、
必ずしもこれに限定されるものではない。このような追
加記憶装置は、図8に取外し可能記憶装置708および
取外し不可能記憶装置710で示してある。コンピュー
タの記憶媒体は、コンピュータ読み取り可能命令、デー
タ構造、プログラムモジュール、その他のデータなどの
情報をストアするための方法または技術で実施される、
揮発性および不揮発性、取外し可能および取外し不可能
な媒体を含む。メモリ704、取外し可能記憶装置70
8および取外し不可能記憶装置710は、すべてコンピ
ュータの記憶媒体の例である。コンピュータの記憶媒体
は、所望の情報をストアするのに使用しコンピュータ装
置700からアクセス可能な、RAM、ROM、EEP
ROM、フラッシュメモリまたはその他のメモリ技術、
CDROM、デジタル多目的ディスク(DVD)または
その他の光学記憶装置、磁気カセット、磁気テープ、磁
気ディスク記憶装置またはその他の磁気記憶装置、また
はその他の媒体を含むが、これらに限定されるものでは
ない。このようなコンピュータの記憶媒体のどれもが、
コンピュータ装置700の一部となり得る。
【0055】コンピュータ装置700はまた、他のコン
ピュータ装置と通信するための1つ以上の通信接続71
2も備える。通信接続712は、通信媒体の例である。
通信媒体は、通常搬送波やその他の転送メカニズムなど
の被変調データ信号内のコンピュータ可読命令、データ
構造、プログラムモジュール、またはその他のデータを
実行し、情報配信媒体を含む。用語「被変調データ信
号」とは、信号内で情報を符号化する方式で設定または
変更した1つ以上の特性を有する信号である。通信媒体
は、ワイヤードネットワークや直接ワイヤード接続など
のワイヤード媒体、および音響、RF、赤外線などのワ
イヤレス媒体を含むが、これらは例として示したものに
すぎず、限定的なものではない。上述したように、本明
細書に使用する用語、コンピュータ可読媒体は、記憶媒
体および通信媒体の両方を含む。
【0056】コンピュータ装置700は、キーボード、
マウス、ペン、音声入力装置、タッチ入力装置などの、
1つ以上の入力装置714も含む。ディスプレイ、スピ
ーカ、プリンタなどの、1つ以上の出力装置716も含
まれる。これらすべての装置は当業界には周知のもので
あり、本明細書で詳細に論じる必要はない。
【0057】本発明の原理を適用することのできる多く
の実施形態について、図面に示した本明細書に記載する
実施形態は、例示の目的で記載してあるのにすぎず、本
発明の範囲を限定するものと解釈されるべきではない。
例えば、ソフトウェア内に例として示した実施形態の要
素はハードウェア内でも実施でき、またその逆も同様で
あり、あるいは例示した実施形態は、本発明の趣旨から
逸脱することなく、配置上のおよび細部の修正が可能で
あることを、当業者なら理解されるであろう。したがっ
て、本明細書に記載した本発明は、以下の請求項および
その均等物の範囲内に含めることのできる、すべてのこ
のような実施形態を予想するものである。
【図面の簡単な説明】
【図1】本発明の一実施形態を実施できる符号器の一例
を示す構造図である。
【図2】本発明の一実施形態における信号のセグメンテ
ーション、タイムワーピング、再構築を示す波形略図で
ある。
【図3】本発明の一実施形態における信号の修正を行う
ためのステップを示す流れ図である。
【図4】本発明の一実施形態における信号の修正を行う
ためのステップを示す流れ図である。
【図5】本発明の一実施形態における最適ラグ輪郭を計
算するためのステップを示す流れ図である。
【図6】最適な最後のサンプルラグを確認するため本発
明の一実施形態において使用する最後のサンプルラグ値
に応じて、相関強度のプロッティングを示す概略特性図
である。
【図7】従来の技術に従って、および本発明の一実施形
態に従って、ワープ輪郭を示す特性図である。
【図8】本発明の一実施形態を実施できるコンピュータ
装置の概略図である。
【符号の説明】
101 予測フィルタまたは逆合成フィルタ 103 残差修正モジュール 105 合成フィルタ 107 CELP符号器 109 音声信号 111 残差信号 113 修正残差 115 修正音声信号 117 符号化したビット 119 アナログ音声信号 121 ディジタイザ 123 LPC抽出装置 201 ピーク 203、205、207、209、211 波形 501、503、505 モデリング関数 601 連続輪郭 603 不連続輪郭 605 領域 607 セクション 700 コンピュータ装置 702 処理ユニット 704 メモリ 708 取外し可能記憶装置 710 取外し不能記憶装置 712 通信接続 714 入力装置 716 出力装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 アジット ブイ.ラオ アメリカ合衆国 98052 ワシントン州 レッドモンド ノースイースト 34 コー ト 166624 ナンバーエスエス−302 Fターム(参考) 5D045 CA01 CC10 DA11 DA20 5J064 AA02 BA13 BB04 BC01 BC11 BC18 BC27 BD03

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】 デジタル音声信号のフレームを圧縮する
    ための準備処理をする方法であって、 不規則な間隔に配置された顕著なピークを有する、前記
    フレームのための線形予測残差を生成するステップと、 前記残差を一列の連続するオーバーラップしないセクシ
    ョンに分割し、各セクションが1つ以下の顕著なピーク
    を含むステップと、 一列の連続するセクション内にある一列の規則的な間隔
    に配置された顕著なピークを有する理想化信号を導出す
    るステップと、 前記残差の各セクションを前記理想化信号の対応するセ
    クションに関連付けるステップと、 各残差セクション用の最後になる可能性のあるサンプル
    ラグ値のサブレンジ内で、各残差セクション用の最後に
    なる可能性のあるサンプルラグ値のサブセットに基づい
    て各残差セクション用の線形連続ワープ輪郭を計算する
    ステップと、 前記計算されたワープ輪郭を前記残差の前記セクション
    に適用して、各残差セクション内のいかなる顕著なピー
    クも前記理想化信号の前記対応するセクション内の前記
    顕著なピークに揃うように前記残差を修正し、それによ
    って前記修正残差の顕著なピッチピークが規則的な間隔
    に配置され、前記修正残差内で前記残差のいかなるセク
    ションの部分も削除されたり繰り返されたりしないステ
    ップとを含むことを特徴とする方法。
  2. 【請求項2】 前記フレーム用の線形予測残差を生成す
    るステップはさらに、 前記フレーム用の線形予測係数を抽出するステップと、 前記フレーム用の前記線形予測係数を補間して、前記フ
    レームの複数のサブフレーム用の線形予測係数を生成す
    るステップと、 各サブフレーム用の予測残差を生成し、それによって前
    記フレーム用の前記予測残差が一組のサブフレーム予測
    残差を有するステップとを含むことを特徴とする請求項
    1に記載の方法。
  3. 【請求項3】 前記残差を一列の連続するオーバーラッ
    プしないセクションに分割するステップはさらに、前記
    フレームを分析して整数ピッチ周期を確認するステップ
    を含むことを特徴とする請求項1に記載の方法。
  4. 【請求項4】 前記フレームを分析して整数ピッチ周期
    を確認するステップはさらに、オープンループ内で相関
    分析を使用するステップを含むことを特徴とする請求項
    3に記載の方法。
  5. 【請求項5】 各残差セクション用の線形連続ワープ輪
    郭を計算するステップはさらに、 前記残差セクションの最初のサンプル用に最初のサンプ
    ルラグを確立するステップと、 前記残差セクションの最後のサンプル用に最後のサンプ
    ルラグ用の一組の候補を確認するステップであって、前
    記一組の候補が、最後になる可能性のあるすべてのサン
    プルラグ値のサブレンジ内で、最後になる可能性のある
    すべてのサンプルラグ値のサブセットからなるステップ
    と、 各候補の最後のサンプルラグ用の前記残差セクションの
    最初と最後のサンプルの間の線形補間を実行し、一組の
    候補ラグ輪郭を生成するステップと、 各候補ラグ輪郭を前記残差セクションに適用して、一組
    の候補修正残差を得るステップと、 各候補修正残差と前記理想化信号の前記対応するセクシ
    ョンの間の相関強度を計算して、一組の相関強度を生成
    するステップと、 前記一組の相関強度に基づいて前記残差セクション用の
    最適な最後のサンプルラグを導出するステップと、 最初のサンプルラグから前記残差セクション用に導出さ
    れた最適な最後のサンプルラグまでのセクション全体を
    線形補間することによって、線形連続ワープ輪郭を導出
    するステップとを含むことを特徴とする請求項1に記載
    の方法。
  6. 【請求項6】 前記一組の相関強度に基づいて前記残差
    セクション用の最適な最後のサンプルラグを導出するス
    テップはさらに、 前記強度を導出するために使用される前記最後のサンプ
    ルラグに応じて、前記一組の相関強度をオーバーラップ
    するサブセクションに分離するステップと、 各サブセクションを曲線として表すステップと、 各曲線の最大値であって、前記サブセクション内で前記
    強度を導出するために使用される前記最後のサンプルラ
    グを含む可能なラグ値の範囲内で可能性のあるすべての
    ラグ値からなるグループから選択可能である前記最大値
    を計算するステップと、 前記サブセクションの前記曲線用の前記最大値に基づい
    て前記セクション用の前記最大相関強度を計算するステ
    ップとを含むことを特徴とする請求項5に記載の方法。
  7. 【請求項7】 前記曲線は多項式であることを特徴とす
    る請求項6に記載の方法。
  8. 【請求項8】 前記多項式は二次関数であることを特徴
    とする請求項7に記載の方法。
  9. 【請求項9】 計算されたワープ輪郭の適用時に前記セ
    クション内のいかなるサンプル用の最大累積シフトも4
    つのサンプル位置未満であるように、各残差セクション
    用の最後になる可能性のあるサンプルラグ値のサブレン
    ジが選択されることを特徴とする請求項1に記載の方
    法。
  10. 【請求項10】 音声信号を符号化する前に前記音声信
    号を修正するための装置であって、 デジタル音声信号を受信するため、および一組の線形予
    測係数を生成するための線形予測係数抽出モジュール
    と、 前記デジタル音声信号と前記線形予測係数とを受信する
    ため、および残差信号を生成するための逆合成フィルタ
    と、 可能性のあるすべてのワープ輪郭の1サブセットのみを
    計算することによって前記一組の可能性のあるすべての
    ワープ輪郭から選択された連続線形ワープ輪郭に基づい
    て前記残差信号をタイムワープし、このことによって顕
    著なピークの不規則ではない規則的な配列を有する修正
    残差信号が生成される残差修正モジュールと、 前記修正残差信号および前記線形予測係数を受信するた
    め、および低ビットレート符号化に合う修正デジタル音
    声信号を生成するための合成フィルタとを備えることを
    特徴とする装置。
  11. 【請求項11】 前記修正デジタル音声信号を受信する
    ため、および圧縮音声信号を生成するためのコードブッ
    ク励起線形予測符号器モジュールをさらに備えることを
    特徴とする請求項10に記載の装置。
  12. 【請求項12】 デジタル音声信号のフレームを圧縮す
    るために準備処理をする方法を実行するためのコンピュ
    ータ可読命令を有するコンピュータ可読媒体であって、 不規則な間隔に配置された顕著なピークを有する、前記
    フレームのための線形予測残差を生成するステップと、 前記残差を一列の連続するオーバーラップしないセクシ
    ョンに分割し、各セクションが1つ以下の顕著なピーク
    を含むステップと、 一列の連続するセクション内にある一列の規則的な間隔
    に配置された顕著なピークを有する理想化信号を導出す
    るステップと、 前記残差の各セクションを前記理想化信号の対応するセ
    クションに関連付けるステップと、 各残差セクション用の最後になる可能性のあるサンプル
    ラグ値のサブレンジ内で、各残差セクション用の最後に
    なる可能性のあるサンプルラグ値のサブセットに基づい
    て各残差セクション用の線形連続ワープ輪郭を計算する
    ステップと、 前記計算されたワープ輪郭を前記残差の前記セクション
    に適用して、各残差セクション内のいかなる顕著なピー
    クも前記理想化信号の前記対応するセクション内の前記
    顕著なピークに揃うように前記残差を修正し、それによ
    って前記修正残差の顕著なピッチピークが規則的な間隔
    に配置され、前記修正残差内で前記残差のどのセクショ
    ンの部分も削除されたり繰り返されたりしないステップ
    とを含むことを特徴とするコンピュータ可読媒体。
  13. 【請求項13】 前記フレーム用の線形予測残差を生成
    するステップはさらに、 前記フレーム用の線形予測係数を抽出するステップと、 前記フレーム用の前記線形予測係数を補間して、前記フ
    レームの複数のサブフレーム用の線形予測係数を生成す
    るステップと、 各サブフレーム用の予測残差を生成し、それによって前
    記フレーム用の前記予測残差が一組のサブフレーム予測
    残差を有するステップとを含むことを特徴とする請求項
    12に記載のコンピュータ可読媒体。
  14. 【請求項14】 前記残差を一列の連続するオーバーラ
    ップしないセクションに分割するステップはさらに、前
    記フレームを分析して整数ピッチ周期を確認するステッ
    プを含むことを特徴とする請求項12に記載のコンピュ
    ータ可読媒体。
  15. 【請求項15】 前記フレームを分析して整数ピッチ周
    期を確認するステップはさらに、オープンループ内で相
    関分析を使用するステップを含むことを特徴とする請求
    項14に記載のコンピュータ可読媒体。
  16. 【請求項16】 各残差セクション用の線形連続ワープ
    輪郭を計算するステップはさらに、 前記残差セクションの最初のサンプル用に最初のサンプ
    ルラグを確立するステップと、 前記残差セクションの最後のサンプル用に最後のサンプ
    ルラグ用の一組の候補を確認するステップであって、前
    記一組の候補が、最後になる可能性のあるすべてのサン
    プルラグ値のサブレンジ内で、最後になる可能性のある
    すべてのサンプルラグ値のサブセットからなるステップ
    と、 各候補の最後のサンプルラグ用の前記残差セクションの
    最初と最後のサンプルの間の線形補間を実行し、一組の
    候補ラグ輪郭を生成するステップと、 各候補ラグ輪郭を前記残差セクションに適用して、一組
    の候補修正残差を得るステップと、 各候補修正残差と前記理想化信号の前記対応するセクシ
    ョンの間の相関強度を計算して、一組の相関強度を生成
    するステップと、 前記一組の相関強度に基づいて前記残差セクション用の
    最適な最後のサンプルラグを導出するステップと、 最初のサンプルラグから前記残差セクション用に導出さ
    れた最適な最後のサンプルラグまでのセクション全体を
    線形補間することによって、線形連続ワープ輪郭を導出
    するステップとを含むことを特徴とする請求項12に記
    載のコンピュータ可読媒体。
  17. 【請求項17】 前記一組の相関強度に基づいて前記残
    差セクション用の最適な最後のサンプルラグを導出する
    ステップはさらに、 前記強度を導出するために使用される前記最後のサンプ
    ルラグに応じて、前記一組の相関強度をオーバーラップ
    するサブセクションに分離するステップと、 各サブセクションを曲線として表すステップと、 各曲線の最大値であって、前記サブセクション内で前記
    強度を導出するために使用される前記最後のサンプルラ
    グを含む可能なラグ値の範囲内で可能性のあるすべての
    ラグ値からなるグループから選択可能である前記最大値
    を計算するステップと、 前記サブセクションの前記曲線用の前記最大値に基づい
    て前記セクション用の前記最大相関強度を計算するステ
    ップとを含むことを特徴とする請求項16に記載のコン
    ピュータ可読媒体。
  18. 【請求項18】 前記曲線は多項式であることを特徴と
    する請求項17に記載のコンピュータ可読媒体。
  19. 【請求項19】 前記多項式は二次関数であることを特
    徴とする請求項18に記載のコンピュータ可読媒体。
  20. 【請求項20】 計算されたワープ輪郭の適用時に前記
    セクション内のいかなるサンプル用の最大累積シフトも
    4つのサンプル位置未満であるように、各残差セクショ
    ン用の最後になる可能性のあるサンプルラグ値のサブレ
    ンジが選択されることを特徴とする請求項12に記載の
    コンピュータ可読媒体。
  21. 【請求項21】 磁気的に可読なディスク媒体を備える
    ことを特徴とする請求項12に記載のコンピュータ可読
    媒体。
  22. 【請求項22】 光学的に可読なディスク媒体を備える
    ことを特徴とする請求項12に記載のコンピュータ可読
    媒体。
  23. 【請求項23】 被変調データ信号を有することを特徴
    とする請求項12に記載のコンピュータ可読媒体。
  24. 【請求項24】 揮発性のコンピュータ読取り記憶装置
    を備えることを特徴とする請求項12に記載のコンピュ
    ータ可読媒体。
JP2002186971A 2001-06-29 2002-06-26 低ビットレートcelp符号化のための連続タイムワーピングに基づく信号の修正 Expired - Fee Related JP4162933B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/896,272 US6879955B2 (en) 2001-06-29 2001-06-29 Signal modification based on continuous time warping for low bit rate CELP coding
US09/896,272 2001-06-29

Publications (3)

Publication Number Publication Date
JP2003122400A true JP2003122400A (ja) 2003-04-25
JP2003122400A5 JP2003122400A5 (ja) 2006-12-28
JP4162933B2 JP4162933B2 (ja) 2008-10-08

Family

ID=25405930

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002186971A Expired - Fee Related JP4162933B2 (ja) 2001-06-29 2002-06-26 低ビットレートcelp符号化のための連続タイムワーピングに基づく信号の修正

Country Status (5)

Country Link
US (2) US6879955B2 (ja)
EP (1) EP1271471B1 (ja)
JP (1) JP4162933B2 (ja)
AT (1) ATE393447T1 (ja)
DE (1) DE60226200T2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009515207A (ja) * 2005-11-03 2009-04-09 ドルビー スウェーデン アクチボラゲット 音声信号のタイムワープ処理改良変換符号化
JP2011521303A (ja) * 2008-07-11 2011-07-21 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 時間軸圧縮曲線計算機、音声信号符号器、符号化された音声信号表現、復号化された音声信号表現の提供方法、符号化された音声信号表現の提供方法、およびコンピュータプログラム
TWI463484B (zh) * 2008-07-11 2014-12-01 Fraunhofer Ges Forschung 時間扭曲致動信號提供器、音訊信號編碼器、用以提供時間扭曲致動信號之方法、用以編碼音訊信號之方法及電腦程式

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7315815B1 (en) * 1999-09-22 2008-01-01 Microsoft Corporation LPC-harmonic vocoder with superframe structure
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
ES2237706T3 (es) 2001-11-29 2005-08-01 Coding Technologies Ab Reconstruccion de componentes de alta frecuencia.
SE0202770D0 (sv) * 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7394833B2 (en) * 2003-02-11 2008-07-01 Nokia Corporation Method and apparatus for reducing synchronization delay in packet switched voice terminals using speech decoder modification
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
EP1864283B1 (en) * 2005-04-01 2013-02-13 Qualcomm Incorporated Systems, methods, and apparatus for highband time warping
DK1875463T3 (en) * 2005-04-22 2019-01-28 Qualcomm Inc SYSTEMS, PROCEDURES AND APPARATUS FOR AMPLIFIER FACTOR GLOSSARY
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US7177804B2 (en) 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US8682652B2 (en) * 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
JP4380669B2 (ja) * 2006-08-07 2009-12-09 カシオ計算機株式会社 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US20090182556A1 (en) * 2007-10-24 2009-07-16 Red Shift Company, Llc Pitch estimation and marking of a signal representing speech
ATE518224T1 (de) * 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
US9082416B2 (en) * 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
PL2550653T3 (pl) * 2011-02-14 2014-09-30 Fraunhofer Ges Forschung Reprezentacja sygnału informacyjnego z użyciem transformacji zakładkowej
SG192748A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Linear prediction based coding scheme using spectral domain noise shaping
AR085218A1 (es) 2011-02-14 2013-09-18 Fraunhofer Ges Forschung Aparato y metodo para ocultamiento de error en voz unificada con bajo retardo y codificacion de audio
CA2827266C (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
TR201903388T4 (tr) 2011-02-14 2019-04-22 Fraunhofer Ges Forschung Bir ses sinyalinin parçalarının darbe konumlarının şifrelenmesi ve çözülmesi.
AR085221A1 (es) 2011-02-14 2013-09-18 Fraunhofer Ges Forschung Aparato y metodo para codificar y decodificar una señal de audio utilizando una porcion alineada anticipada
CN103534754B (zh) 2011-02-14 2015-09-30 弗兰霍菲尔运输应用研究公司 在不活动阶段期间利用噪声合成的音频编解码器
MX2013009344A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral.
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
MX352099B (es) 2013-06-21 2017-11-08 Fraunhofer Ges Forschung Método y aparato para obtener coeficientes de espectro para un cuadro de reemplazo de una señal de audio, decodificador de audio, receptor de audio y sistema para transmitir señales de audio.
US9985815B2 (en) * 2016-08-25 2018-05-29 Intel IP Corporation Signal processing chain switching
CN112951209B (zh) * 2021-01-27 2023-12-01 中国科学技术大学 一种语音识别方法、装置、设备及计算机可读存储介质

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4561102A (en) * 1982-09-20 1985-12-24 At&T Bell Laboratories Pitch detector for speech analysis
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
JPS6295599A (ja) 1985-10-23 1987-05-02 株式会社リコー 残差駆動型音声合成方式
JPS62189833A (ja) * 1986-02-17 1987-08-19 Hitachi Ltd 音声符号化復号化装置
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
JPH0782359B2 (ja) * 1989-04-21 1995-09-06 三菱電機株式会社 音声符号化装置、音声復号化装置及び音声符号化・復号化装置
GB2235354A (en) * 1989-08-16 1991-02-27 Philips Electronic Associated Speech coding/encoding using celp
JP3199142B2 (ja) 1993-09-22 2001-08-13 日本電信電話株式会社 音声の励振信号符号化方法および装置
JPH07160299A (ja) * 1993-12-06 1995-06-23 Hitachi Denshi Ltd 音声信号帯域圧縮伸張装置並びに音声信号の帯域圧縮伝送方式及び再生方式
US5781880A (en) 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
US5602959A (en) * 1994-12-05 1997-02-11 Motorola, Inc. Method and apparatus for characterization and reconstruction of speech excitation waveforms
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
US5648989A (en) * 1994-12-21 1997-07-15 Paradyne Corporation Linear prediction filter coefficient quantizer and filter set
US5704003A (en) 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
US6240384B1 (en) * 1995-12-04 2001-05-29 Kabushiki Kaisha Toshiba Speech synthesis method
JP3531780B2 (ja) 1996-11-15 2004-05-31 日本電信電話株式会社 音声符号化方法および復号化方法
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
JP3296411B2 (ja) 1997-02-21 2002-07-02 日本電信電話株式会社 音声符号化方法および復号化方法
GB9718026D0 (en) * 1997-08-27 1997-10-29 Secr Defence Multi-component signal detection system
US5963897A (en) * 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
US6330533B2 (en) 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6113653A (en) * 1998-09-11 2000-09-05 Motorola, Inc. Method and apparatus for coding an information signal using delay contour adjustment
JP3180786B2 (ja) * 1998-11-27 2001-06-25 日本電気株式会社 音声符号化方法及び音声符号化装置
US6311154B1 (en) 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US6223151B1 (en) * 1999-02-10 2001-04-24 Telefon Aktie Bolaget Lm Ericsson Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders
US6732070B1 (en) * 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012068660A (ja) * 2005-11-03 2012-04-05 Dolby International Ab 音声信号のタイムワープ処理改良変換符号化
JP2009515207A (ja) * 2005-11-03 2009-04-09 ドルビー スウェーデン アクチボラゲット 音声信号のタイムワープ処理改良変換符号化
US8838441B2 (en) 2005-11-03 2014-09-16 Dolby International Ab Time warped modified transform coding of audio signals
US8412518B2 (en) 2005-11-03 2013-04-02 Dolby International Ab Time warped modified transform coding of audio signals
US9015041B2 (en) 2008-07-11 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9025777B2 (en) 2008-07-11 2015-05-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal decoder, audio signal encoder, encoded multi-channel audio signal representation, methods and computer program
JP2014130359A (ja) * 2008-07-11 2014-07-10 Fraunhofer Ges Zur Foerderung Der Angewandten Forschung Ev 音声信号符号器、符号化されたマルチチャンネル音声信号表現の生成方法およびコンピュータプログラム
JP2011521304A (ja) * 2008-07-11 2011-07-21 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声信号復号器、時間軸圧縮曲線データ提供装置、復号化された音声信号の提供方法、およびコンピュータプログラム
TWI453732B (zh) * 2008-07-11 2014-09-21 Fraunhofer Ges Forschung 時間扭曲輪廓計算器、音訊信號編碼器、編碼音訊信號表現型態、方法及電腦程式
TWI463484B (zh) * 2008-07-11 2014-12-01 Fraunhofer Ges Forschung 時間扭曲致動信號提供器、音訊信號編碼器、用以提供時間扭曲致動信號之方法、用以編碼音訊信號之方法及電腦程式
JP2011521303A (ja) * 2008-07-11 2011-07-21 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 時間軸圧縮曲線計算機、音声信号符号器、符号化された音声信号表現、復号化された音声信号表現の提供方法、符号化された音声信号表現の提供方法、およびコンピュータプログラム
JP2011521305A (ja) * 2008-07-11 2011-07-21 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声信号復号器、音声信号符号器、マルチチャンネル音声信号表現、復号化されたマルチチャンネル音声信号表現の提供方法、符号化されたマルチチャンネル音声信号表現の提供方法およびコンピュータプログラム
US9043216B2 (en) 2008-07-11 2015-05-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal decoder, time warp contour data provider, method and computer program
US9263057B2 (en) 2008-07-11 2016-02-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9293149B2 (en) 2008-07-11 2016-03-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9299363B2 (en) 2008-07-11 2016-03-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp contour calculator, audio signal encoder, encoded audio signal representation, methods and computer program
US9431026B2 (en) 2008-07-11 2016-08-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9466313B2 (en) 2008-07-11 2016-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9502049B2 (en) 2008-07-11 2016-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9646632B2 (en) 2008-07-11 2017-05-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs

Also Published As

Publication number Publication date
EP1271471B1 (en) 2008-04-23
EP1271471A3 (en) 2004-01-28
EP1271471A2 (en) 2003-01-02
DE60226200D1 (de) 2008-06-05
US20050131681A1 (en) 2005-06-16
JP4162933B2 (ja) 2008-10-08
US7228272B2 (en) 2007-06-05
US6879955B2 (en) 2005-04-12
US20030004718A1 (en) 2003-01-02
ATE393447T1 (de) 2008-05-15
DE60226200T2 (de) 2009-05-14

Similar Documents

Publication Publication Date Title
JP4162933B2 (ja) 低ビットレートcelp符号化のための連続タイムワーピングに基づく信号の修正
EP1886307B1 (en) Robust decoder
US11282530B2 (en) Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
RU2407071C2 (ru) Способ генерации кадров маскирования в системе связи
JP2003044097A (ja) 音声信号および音楽信号を符号化する方法
EP1385150B1 (en) Method and system for parametric characterization of transient audio signals
US20080306732A1 (en) Method and Device for Carrying Out Optimal Coding Between Two Long-Term Prediction Models
KR20220045260A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
US6535847B1 (en) Audio signal processing
JP4007730B2 (ja) 音声符号化装置、音声符号化方法および音声符号化アルゴリズムを記録したコンピュータ読み取り可能な記録媒体
EP0987680A1 (en) Audio signal processing
KR19980035867A (ko) 음성 데이터 부호화/복호화장치 및 그 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050613

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050613

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061115

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20061115

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20061211

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061215

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070315

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070320

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070608

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080624

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080723

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130801

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees