JPH08254994A - 分類化及び輪郭の目録(インベントリー)による音声符号化パラメータの配列の再構成 - Google Patents
分類化及び輪郭の目録(インベントリー)による音声符号化パラメータの配列の再構成Info
- Publication number
- JPH08254994A JPH08254994A JP7334367A JP33436795A JPH08254994A JP H08254994 A JPH08254994 A JP H08254994A JP 7334367 A JP7334367 A JP 7334367A JP 33436795 A JP33436795 A JP 33436795A JP H08254994 A JPH08254994 A JP H08254994A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- parameter
- encoded
- output
- decoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 23
- 238000000034 method Methods 0.000 claims description 45
- 230000001747 exhibiting effect Effects 0.000 claims 3
- 230000006870 function Effects 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000013139 quantization Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0018—Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0012—Smoothing of parameters of the decoder interpolation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
よる音声符号化のパラメータの再構成 【解決手段】音声符号化のパラメータは、音声の信号出
力を含みうる。当該パラメータは、ブロック毎を元に処
理される。ブロックの境界におけるパラメータの値は、
差分量子化の手段のような従来の方法によって、伝送さ
れる。ブロックの境界内での再構成されたパラメータの
輪郭の形状は、分類化に基づいている。分類化は、ブロ
ック内でのパラメータの輪郭について知覚上重要な特徴
を決定付けるものである。ブロックの境界におけるパラ
メータの値はもちろん、分類化の結果に基づいて、パラ
メータの輪郭(当該ブロック内での)が、考えられるパ
ラメータの輪郭の目録(インベントリー)から選択され
る。
Description
ムに関し、特に、音声符号化システムにおけるパラメー
タの量子化に関する。
ットワークを通しての通信のために、音声信号の符号語
による表示を、システム受信器へ提供する機能を果たし
ている。各システム受信器は、受信した符号語から音声
信号を再構成する。与えられた時間間隔内でシステムに
よって通信された符号語情報の量が、システムの帯域幅
を定義付け、システム受信器によって受信された音声の
質に影響を及ぼすのである。
質、通信路の質、帯域幅の限定、コストといったような
副次的な条件が与えられているときに、音声の質と帯域
幅の間のトレードオフ関係の内で最良のものを提供する
ということにある。音声信号は、伝送のために量子化さ
れるパラメータの組み合わせによって表示される。おそ
らく、音声符号器の設計において、音声信号を記述する
ためのパラメータの良い組み合わせを探求するというこ
とは、もっとも重要なことである。パラメータの良い組
み合わせの場合、知覚的にも正確な音声信号の再構成に
も、低速度のシステムの帯域幅しか必要としない。加え
て、パラメータの組み合わせとして望ましい特性は、パ
ラメータが独立しているということである。パラメータ
が独立しているときには、量子化器は独立して設計され
ることが可能であり、不正確に受信された情報でも、再
構成された音声信号の質への影響をより少なくするであ
ろう。各パラメータに要求される帯域幅は、各パラメー
タが変化する速度(レート)とパラメータの値の軌跡
が、要求された質を有する再構成された音声を得るため
に記述される必要のある精度についての関数である。
み合わせのひとつのパラメータとしては、望ましいもの
である。その他のパラメータは、容易に信号出力と独立
となされる。さらに、信号出力は、音声信号の物理的特
性を表示しており、量子化器のための設計上の判断基準
を定義付けることを容易にするものである。信号出力
は、準周期的な音声部分については1ピッチ周期にわた
って、さらに非周期的な音声部分については、ある程度
の所定の時間間隔にわたって平均化された、サンプル毎
の信号のエネルギーとして定義されることが可能であ
る。非周期的部分に対する時間間隔は、知覚的に有意
(重要)であるために、十分に短くあるべきである。
(5msあるいはそれ以下が有効である。)このような
定義を用いると、持続した母音の間では、音声信号の出
力はなめらかな関数となり、音の出だしや破裂音を明確
に示すことになる。
は、固定したあるいは大きなウインドウ(窓)サイズで
は得られることができない。推定(見積もり)のための
大きなウインドウ(窓)サイズは、推定(見積もり)さ
れた信号出力について、低い時間分解能に結びつく。結
果として、このようなアプローチを用い、低いレートの
符号器をもって再構成された音声は、一般に鋭さ(歯切
れの良さ)が欠けていることになる。一方で、短い、固
定されたウインドウ(窓)は、信号出力の不安定さへ結
びつく。このようなことから、CELP(Code−E
xcited−Linear−Predictive,
Code−Excited LPC)方式といったよう
な、短く固定したウインドウを用いる符号器は、一般に
信号出力を明示的なパラメータとしては用いていない。
(なお、例えば、B.S.Atal,"High-Quality Speech at L
ow Bit Rates:Multi-Pulse and Stochastically Excite
dLinear Predictive Coders,"Proc.Int.Conf.Acoust.Sp
eech Sign.Process.,Tokyo,pp.1681-1684,1986等を参照
のこと。)
独立して符号化がなされるための明示的なパラメータと
して、信号出力を利用する符号器がさらに増えることが
期待されている。最近では、特徴的な波形という点から
音声信号を記述し、高レートで(およそ500Hz)サ
ンプリングされる、符号化処理が導入されてきた。(な
お、例えば、W.B.Kleijin and J.Haagen,"Transformati
on and Decompositionof the Speech Signal for Codin
g,"IEEE Signal Processing Letters,Vol.1,September
1994,pp.136-138.等を参照のこと。)これらの、いわゆ
る波形補間による符号器においては、信号出力の推定
(見積もり)ウインドウ(窓)は1ピッチ周期である。
(音声については)これらの新しい波形補間符号器は、
高い時間分解能をもって、非常に正確な信号出力の推定
(見積もり)をする解析を用いている。当該信号出力は
独立に符号化される。
ている、従来からの符号化技術においては、信号出力
は、かなり低速度(低いビット伝送速度)で伝送されて
いる。長時間にわたって更新される時間間隔を通じての
直線補間は、その際、信号出力の輪郭を再構成するため
に用いられている。(このような補間は、しばしば出力
のlog表示(対数表示)に対して当てはめられること
が多い。)(なお、例えば、T.E.Tremain,"The Governm
ent Standard Linear Predictive Coding Algorithm,"S
peech Technology,pp40-49,April 1982.等を参照のこ
と。)出力の輪郭についてのより詳細な記述を行うこと
は、再構成された信号の質を改良することになるであろ
う。しかしながら、課題は、信号出力の輪郭について単
に知覚的に重要な詳細部分のみを伝送するということに
留まり、低いビット伝送速度が未だ用いられ得るのであ
る。
号化パラメータの知覚的に重要な特徴の伝送を許容する
方法及び装置を提供するものである。例えば、音声符号
化パラメータは、音声の信号出力を含みうる。パラメー
タは、ブロック毎を基本として処理されている。ブロッ
クの境界におけるパラメータ値は、例えば差分量子化の
手段といったような従来からの方法によって伝送されて
いる。そこで、本発明においては、ブロック境界内の再
構成されたパラメータの輪郭の形状は、分類化に基つ゛
くものとなっている。分類化は、ブロック内でのパラメ
ータの輪郭の知覚的に重要な特徴に依存するものであ
る。分類化は、符号器の伝送側末端(例えば、高い時間
分解能を有する元のパラメータの輪郭やその他、同様の
考えられ得る音声のパラメータを用いて)あるいは符号
器の受信器側末端(例えば、伝送されたパラメー−タの
値、及びその他、同様の考えられ得る伝送された音声の
パラメータを用いて)のいずれにおいても実行されるこ
とが可能である。ブロックの境界におけるパラメータの
値同様、分類化の結果を元にして、パラメータの輪郭
(ブロック内での)が、考えられるパラメータの輪郭の
目録(インベントリー)から選択される。
質、ハードウエア、遅延による制約に従った場合に、再
構成された音声の質と要求された帯域幅の間のトレード
オフ関係の内で望ましいものを得るということにある。
一般的に、音声信号についてはモデルが用いられてお
り、時間の関数としてのモデルとなるパラメータ(ベク
トルともなりうるが)の軌跡が、ある精度をもって伝送
されている。(もっとも単純なモデルにおいては、モデ
ルとなるパラメータは、音声信号そのものである。)デ
ジタル音声符号器では、モデルとなるパラメータの軌跡
はスカラー量あるいはベクトル量のサンプルの配列とし
て記述されている。これらのパラメータは低速度(低い
ビット伝送速度)で伝送される場合が考えられ、軌跡
は、更新されている各点間での補間により再構成されて
いる。選択的には、予測器(線形予測器である場合があ
り得る。)が、前に再構成されたサンプルからパラメー
タを予測するために用いられ、実際の値と予測された値
の間の違い(残差)のみが伝送される。さらに他の処理
においては、パラメータの軌跡の、高い時間分解能を有
する記述が、逐次的なブロックに分割されうる場合があ
る。このような逐次的なブロックは、伝送のために量子
化されたベクトルである。符号器の中には、ベクトル量
子化と予測が組み合わされているものがある。
メータの軌跡(ベクトルである場合もあり得る。)は、
上述した補間、予測、ベクトル量子化処理の方法を増加
させる方法で伝送される。パラメータは、ブロック毎を
基本に伝送され、各ブロックは、分析を行う側で、複数
のパラメータのサンプルを含んでいる。パラメータの信
号は、低域フィルターをかけられダウンサンプリングさ
れる。このダウンサンプリングされたパラメータ配列
は、従来の手段に従って伝送される。(例えば、次のセ
クションにおいて記述されている例示的な実施例におい
ては、この従来からの伝送では、差分量子化器を用いて
いる。)受信器においては、パラメータ配列は、音声モ
デルにより再構成されるために必要なレートまで、アッ
プサンプリングされなくてはならない。アップサンプリ
ングのために帯域制限や直線補間が用いられているとき
には、明らかに、信号の特徴は失われていることにな
る。本発明の例示的な実施例においては、パラメータの
軌跡の知覚的に重要な特徴を識別するために、分類化が
用いられており、そうでない場合、補間のみを元にして
再構成されたパラメータ配列においては、このようなパ
ラメータの軌跡の知覚的に重要な特徴は存在しないこと
になる。このような分類化の結果によって、ブロックの
境界におけるサンプル間のパラメータの軌跡を構成する
ために、軌跡の目録(インベントリー)からひとつの軌
跡が選択される。さらに、この目録(インベントリー)
はブロックの境界におけるパラメータの値に適応してい
る。ここで記述された例示的な方法は、必ずしも付加的
な情報の伝送を必要とするものではない。すなわち、伝
送され、ダウンサンプリングが行われたパラメータの配
列のみを用いて、符号器の受信器側末端において、分類
化は実行される。
実施例においては、上で記述された処理が、特に音声出
力に対して適用されている。ステップ形をした輪郭の音
声信号は、平滑な輪郭をした音声信号とは、有意に異な
って聞こえる。平滑な輪郭は、持続した音声の音に典型
的にみられる一方、ステップ形をした輪郭は、音の出だ
しを発音する際に共通してみられる。伝送され、ダウン
サンプリングされた音声出力の配列を用いる、単純な分
類化のスキームでは、高い信頼性をもって、ステップ形
をした音声信号の輪郭を識別することが可能である。そ
こでは、ステップ形をした輪郭は、再構成された信号出
力の配列のために用いられている。実験により、音声出
力の信号におけるステップの正確な位置は、認識された
音声の質にとって、僅かな重要性しか有していないとい
うことが示されている。
類化は、破裂音のようなサンプル間でのエネルギーの輪
郭における特徴を識別するために、用いられることが可
能である。また、再構成された破裂音の正確な位置も、
ごく僅かな知覚上の重要性しか有していない。このよう
に、伝送側末端において破裂音が識別されたときには常
に、音声出力の信号における単純な膨らみ(隆起)部分
が、ブロックの中央に加えられることになる。
力の抽出を実行する、本発明の例示的な実施例の伝送側
部分を示している。元の音声信号は、最初に、符号化ユ
ニット(エンコーデイングユニット)101において処
理される。波形補間符号器においては、この符号化ユニ
ット(エンコーデイングユニット)は特徴的な波形を抽
出する。これらの特徴的な波形は、音声が発音されてい
る間の1ピッチ周期に対応している。既知の方法に従っ
て、音声信号は、特徴的な波形の配列(線形予測による
差の部分で定義される。)、ピッチ周期での軌跡、時間
変化する線形予測係数によって表示される。そのような
技術は、例えば、本発明の譲受人に譲り受けられた、共
に出願中のU.S.Patent application Ser.No.08/179,831
(米国特許出願番号No.08/179,831)の、
W.B.Kleijinによる"Method andAppratus For Prototype
Waveform Speech Coding"において、記述されており、
参照することで、ここで十分に示されるのと同様に、こ
のような技術が組み入れられている。(なお、さらに、
例えば、W.B.Kleijin,"Encoding Speech UsingPrototyp
e Waveforms,"IEEE Trans.Speech and Audio Processin
g,Vol.1,No.4,pp.386-399,1993及びW.B.Kleijin and J.
Haagen,"Transformation andDecomposition of the Spe
ech Signal for Coding,"IEEE Signal ProcessingLette
rs,Vol.1,September 1994,pp.136-138.等を参照のこ
と。)
フーリエ系列の形式をとっている。特徴的な波形は残り
(差)の部分で記述される。というのは、このようにす
ることで、抽出化及び量子化が容易となるからである。
特徴的な波形のサンプリング(抽出化)レートは、およ
そ500Hzに合わせられるのが有効である。本図にお
いては、以下の図面同様、ピッチ周期での軌跡、線形予
測係数は、これらのパラメータを必要とする、あらゆる
処理ユニット(プロセッシングユニット)に対しても利
用可能なものであると考えられる。ピッチ周期での軌跡
及び線形予測係数の両方とも、従来の方法に従って定義
付けられ、補間されているのである。
(図1においては、量子化されていない中間的な信号と
して表記されている。)は、出力抽出器102へと供給
される。出力抽出器102においては、特徴的な波形の
残り(差)の部分が、まず、線形予測合成フィルターを
用いた巡回畳み込みという手段により、当該特徴的な波
形の音声部分へと変換される。(このような畳み込み
は、例えば、W.B.Kleijin,"Encoding Speech Using Pro
totype Waveforms,"IEEE Trans.Speech and AudioProce
ssing,Vol.1,No.4,pp.386-399,1993の式(19)の手段
により、直接的にフーリエ系列を元にして実行されるこ
とが可能である。)音声部分での信号出力は、線形予測
係数における伝送誤り(エラー)が、音声信号の出力に
影響を及ぼすことを避けることから、用いられるのであ
る。
プルについて、特徴的な波形の出力を算出する。出力
は、信号出力がピッチ周期に依存しないように、サンプ
ルベース毎に正規化される。これによって、量子化を容
易にし、ピッチ周期に影響を及ぼす通信路での誤り(エ
ラー)に対して、出力が影響を受け難くすることにな
る。最終的には、出力抽出器102は、結果として得ら
れる音声部分の出力を、音声部分の出力の対数(表示)
に変換する。例えば、広く知られている、デシベル(d
B)のlogスケール(表示)が、このような目的のた
めに用いられ得るであろう。(線形信号出力よりもむし
ろ信号出力の対数(表示)を利用することの方が、人間
の知覚特性に動機付けられたものである。人間の耳は、
何桁ものオーダーの大きさにわたって変化する信号出力
を扱うことが可能である。)特徴的な波形と同じレート
でサンプリングされた、このような信号は破裂音検出器
105、低域フィルター106、正規化器(ノーマライ
ザー)103へと供給される。正規化器(ノーマライザ
ー)103は、正規化された特徴的な波形を作り出すた
めに、抽出された信号出力を用いている。このような正
規化された特徴的な波形は、さらに符号化ユニット(エ
ンコーデイングユニット)104において、符号化さ
れ、また、信号出力を付加的な情報として利用する場合
もあり得るであろう。
れる)を避けるために、低域フィルター106は、ダウ
ンサンプラー107の出力信号についてのサンプリング
周波数の半分を越える周波数を取り除く。2.4Kb/
sの符号器についていえば、ダウンサンプリングを行っ
た後のサンプリング周波数は、100Hz(ここで与え
られた実施例においては、5という係数でダウンサンプ
リングがなされることに対応している。)に合わせられ
ることが有効である。
は、ダウンサンプリングされたlog表示の出力配列を
符号化(エンコード)する。これは、差分量子化器を用
いて処理されることがより有効である。ここで、サンプ
リング時刻nにおけるlog表示の出力がx(n)であ
るとしよう。すると、差分信号e(n)を量子化するた
めには、単なるスカラー量の量子化器が用いられ、すな
わち、 e(n)=x(n)−α*x(n−1) (1) と表せる。Q(e(n))は、e(n)の量子化された
値を表示するものとしよう。すると、再構成されたlo
g表示による出力は、 X(n)=Q(e(n))+α*x(n−1) (2) となる。1以下のαについては、等式(2)は、良く知
られている、leakyintegrator(漏出積
分器)を示している。leaky integrato
r(漏出積分器)の機能は、通信路における誤り(エラ
ー)への感度を減少させるということにある。α=0.
8という値が用いられることが有効である。
log表示の出力の配列と低域フィルターをとおしたl
og表示の出力の配列を利用する。ダウンサンプリング
されたlog表示の出力の配列のサンプル間における各
時間間隔(例えば、100Hzという、ダウンサンプリ
ングされたサンプリングレートに基つ゛いた場合の10
msといった)について、破裂音検出器の出力は、2つ
の判断となる。すなわち、1が破裂音を検出したことを
意味する一方で、0は破裂音が検出されなかったことを
意味している。
示されている。ピーククリアランス検出器304は、l
og表示の出力のサンプルから、同じサンプルで低域フ
ィルターをとおしたlog表示の出力の配列を引いた値
が、所与の閾値よりも大きいかについて判断がなされ
る。(例えば、このような閾値は、信号出力のlog表
示については、16dBに合わせられることが有効であ
る。)もし、このような場合、ピーククリアランス検出
器304の出力は1であり、そうでない場合には出力は
0である。
図6に例示されている。概念的には、ハット形の曲線
が、ここでの出力信号サンプルから、いわば吊るされて
いることになる。すなわち、ハットに相当する部分の頂
上部は、ここでのサンプルの頂上部に等しいレベルに合
わせられている。ハットクリアランス検出器303の出
力は、ハットの形状によりカバーされている部分のサン
プルが、ハット及びその周辺部より下に適合しているな
らば、1となる。例えば、図5は当該ハットが隣接する
サンプルとの衝突を避けていない状況であることを示し
ている。このようなことから、ハットクリアランス検出
器303の出力は0である。一方、図6は、当該ハット
が隣接するサンプルとの衝突を避けている状況であるこ
とを示している。このようなことから、ハットクリアラ
ンス検出器303の出力は1である。ハットの特性はハ
ットキーパー302に保存されている。ハットの形状は
検出間隔の範囲内で変化させることが可能であり、周辺
部の高さは左側と右側で異ならせることが可能である。
例えば、ハットが左右対称である場合には、ハットの頂
上部の幅及び周辺部の幅は、それぞれ、5msに合わせ
られることが有効であり得るし、頂上部までの周辺部の
距離は、信号出力のlog表示を記述している輪郭につ
いては、12dBに合わせられることが有効であり得
る。例えば、ハットクリアランス検出器303が、サン
プルのレベルのテストを行い、これらのレベルと与えら
れた所定の閾値とを比較するためのサンプルメモリー及
びプロセッサーをもって補足されうるということは、当
業者の認めるところであろう。
は、ピーククリアランス検出器304からの出力とハッ
トクリアランス検出器303からの出力を結びつける。
もしこれらの2つの出力のいずれかひとつが0であるな
らば、論理的にANDの機能を持つ演算器305の出力
は0となる。論理的にはORの機能を持ったダウンサン
プラー306は、各時間間隔について、ダウンサンプリ
ングされたlog表示の出力の配列という、ひとつの出
力を有する。(すなわち、ダウンサンプラー107の出
力)例えば、前に記述された例としてのケースについて
は、これは10ms毎に一出力ということになろう。も
し、論理的にはORの機能を持ったダウンサンプラー3
06への入力が、このような時間間隔内でのいかなると
きにおいても0でない場合には、論理的にはORの機能
を持ったダウンサンプラー306の出力は1に合わせら
れる。そして、このことは、破裂音が検出されたという
ことを示している。もし入力が時間間隔内でのいかなる
ときにおいても0である場合には、論理的にはORの機
能を持ったダウンサンプラー306の出力は0に合わせ
られる。これは、破裂音は検出されなかったことを示し
ている。
対応した本発明における例示的実施例の受信部分を示し
ている。復号器(デコーダー)ユニット201は特徴的
な波形を再構成する。復号器(デコーダー)ユニット2
01の中で実行される操作のいくつかは伝送器において
実行される操作に対応していない。例えば、出力信号の
スペクトル形状を強調するために、特徴的な波形に対し
て、形状が成形される前のスペクトルが加えられる場合
がありうる。このことは、復号器(デコーダ)ユニット
201の出力を形成する特徴的な波形は、一般的に、正
規化された出力を有することが保証されていないという
ことを意味している。このようなことから、量子化され
た特徴的な波形をスケーリングする(換算する)に先だ
って、これらの出力が評価されなくてはならない。これ
は、出力抽出器102と類似した方法で機能する、出力
抽出器202によってなされる。また、出力は音声の部
分において評価される。
サー206は復号器(デコーダ)ユニット201によっ
て生成された特徴的な波形に適用されるべき適切なスケ
ールファクター(換算係数)を決定する。それぞれの特
徴的な波形については、スケールファクター(換算係
数)プロセッサー206への入力は、伝送された情報か
ら再構成された、log表示の出力値であり、スケーリ
ングを行う(換算を行う)前の量子化された特徴的な波
形である。log表示の出力値は、線形の出力値に変換
され、スケーリングされていない量子化された特徴的な
波形の出力により割られる。このような除法が、スケー
リングされていない量子化された特徴的な波形にとって
の適切なスケールファクター(換算係数)を作り出すこ
とになる。結果として生じるスケールファクター(換算
係数)は増幅器207において用いられ、この増幅器は
その出力として、適切にスケーリングされた量子化され
た特徴的な波形を有する。この特徴的な波形は復号器
(デコーダ)ユニット203の入力であり、この復号器
(デコーダ)ユニットが、特徴的な波形の配列の記述を
(ピッチ周期での軌跡及び線形予測係数による補助も共
に)再構成された音声信号へと変換する。復号器(デコ
ーダ)ユニット203において用いられた、良く知られ
ている方法は、例えば、U.S.Patent application Ser.N
o.08/179,831(米国特許出願番号No.08/179,
831)に記述されている。
成が説明されよう。出力復号器(パワーデコーダー)2
04は、ダウンサンプリングされ、量子化されたlog
表示の出力の配列を、上の式(2)に基つ゛いて再構成
する。出力(パワー)エンベローププロセッサー205
は、このダウンサンプリングされた配列をサンプリング
がなされていないlog表示の出力の配列へと変換す
る。出力(パワー)エンベローププロセッサー205の
操作は、図4に詳細に例示されている。第一に、破裂音
についての情報が0である場合(破裂音が存在しないと
いうことを示している。)が考えられるであろう。出力
ステップ評価器(パワーステップエバリュエター)40
1が、ダウンサンプリングされた配列の、現在でのlo
g表示での出力値から、ダウンサンプリングされた配列
の、前のlog表示での出力値を差し引くことで、その
差を決定する。アップサンプラー402は、アップサン
プリング処理に従って、log表示の出力の配列をアッ
プサンプリングする。とりわけ、アップサンプラー40
2により実行されるアップサンプリング処理は、連続的
なサンプル(出力ステップ評価器(パワーステップエバ
リュエター)401により決定される。)間の差を閾値
と比較することを元にして選択される。例えば、閾値
は、音声出力のlog表示では12dbで、100Hz
というサンプリングレートに選ばれることが有効であり
得る。更新される各点間での直線補間は、連続的なサン
プル間の差が当該閾値よりも小さい場合には、アップサ
ンプラー402により実行される。ほとんどの時間間隔
についてもこのような場合が当てはまり、図7に例示さ
れている。図7は、ダウンサンプリングされたlog表
示での出力の配列について、2つのサンプル値を太線で
示している。これらの2つのサンプル値の間のサンプル
は直線補間により得られる。
差が閾値を越えるような、より大きな増加は、主として
シャープに発音された音の出だしにおいて生じる。lo
g表示の出力の直線補間は、そのような音の出だしにと
っては良いモデルであるとはいえない。それ故に、この
ような場合、アップサンプラー402はステップ形をし
た輪郭を利用する。とりわけ、連続的なサンプル間の差
が当該閾値を越えるときはいつも、左側のlog表示の
出力値(すなわち、前のサンプル)が、当該時間間隔の
中点に至るまで用いられ、右側のlog表示の出力値
(すなわち、現在におけるサンプル)は、当該時間間隔
の残りの部分に対して用いられる。この例については、
図9に例示されている。一般には、当該ステップは、元
の信号の出だしと同じ(時間的)瞬間には位置しないと
考えられる。しかしながら、人間の知覚にとって、出力
の輪郭におけるステップの正確な位置は、当該時間間隔
内に平滑な輪郭よりもステップが含まれているというこ
とに比べて、あまり重要ではないのである。
果は、再構成された音声信号を、目立ってより鋭く(歯
切れを良く)するということがある。しかしながら、ス
テップ形をした出力の輪郭を無分別に用いるということ
は、出力信号の質の重大な低下という結果へつながるの
である。信号出力が、急速に変化している場合につい
て、ステップ毎の輪郭を利用することを限定すること
は、結果として、直線補間された輪郭について絶えず一
貫して利用する場合に比べて、改良された音声の質を得
られることになる。さらに、信号出力が、急速ではある
が滑らかに変化している場合について、ステップ毎の輪
郭を利用しても、再構成された音声に重大な影響をもた
らすものではないのである。
(破裂音が存在しているということを示している。)場
合が考えられよう。また、これは図4に関連して記述さ
れている。破裂音が存在しているときには、破裂音加算
器(破裂音アダー)403が、当該破裂音が存在してい
ると知られている時間間隔内での、サンプリングされて
いないlog表示の出力の配列の一つあるいはそれ以上
の特定のサンプルに対して、固定値を加算する。例え
ば、信号出力のlog表示については、1.2という固
定値が用いられることが有効であるかもしれないし、こ
の値は、5msという時間間隔でのlog表示の出力の
信号に加えられることが有効であるかもしれない。図8
は、本来は直線補間がなされる輪郭の場合について、破
裂音が加えられていることを例示している。図9は、ス
テップ毎の輪郭の場合について、破裂音が加えられてい
ることを例示している。後者の場合について、破裂音は
ステップの後に加えられることが有効である。そうでな
いと、聞き取ることができないであろう。
は、2つの、関連するが区別できる、分類化処理を含ん
でいる。例えば、図4において示されているように、出
力ステップ評価器(パワーステップエバリュエター)4
01は、2つの連続的なサンプル間のlog表示の出力
の輪郭が、直線的に補間され得るのかどうか、あるい
は、ステップ形をした輪郭が提示されうるのかというこ
とを決定するのである。加えて、破裂音加算器(破裂音
アダー)403が、破裂音が2つの連続的サンプル間の
log表示の出力の輪郭に加えられ得るのかどうかにつ
き、決定するのである。本発明のその他の例示的実施例
においては、これらの処理のいずれか一つは、その他の
処理とは独立に実行されうるのである。
実施例は、個々の機能的なブロックあるいはプロセッサ
ーを含むものとして提示されている。これらのブロック
が提示する機能は、限定はされないが、ソフトウエアを
実行できるハードウエアを含む、共有化あるいは専用化
されたハードウエアのいずれかの利用を通じて提供され
うるのである。例えば、図1から図4までで示されたプ
ロセッサーの機能は単一の共有化されたプロセッサーに
よって提供されうる。(いわゆる、プロセッサーという
語の利用は、もっぱらソフトウエアを実行可能なハード
ウエアのみを呼称するものと解釈されるべきではな
い。)
あるいはDSP32Cといったような、デジタル信号プ
ロセッサー(DSP)、これまで論じられた操作を実行
するソフトウエアを保存するための読み出し専用メモリ
ー(ROM)、DSPによる結果を保存するためのラン
ダムアクセスメモリー(RAM)を含みうる。超大規模
集積回路(VLSI)ハードウエアの実施例もまた、一
般的な用途用のDSP回路と結びつけてカスタム化され
たVLSI回路と同様、提供されうる。
も示され、また記述されてきたが、これらの実施例は単
に、本発明の原理の応用において案出可能な、考えられ
る多くの特定の配置を例示しているものに過ぎないとい
うことは理解されるべきである。これらの原理に従っ
て、非常に多くの、そして変化に富んだ他の配置が、本
発明の真意及び範囲から離れることなく、当業者によっ
て案出されうるのである。
パラメータについて、知覚的に重要な特徴を伝送するこ
とが可能となり、パラメータの輪郭についてのより詳細
な記述が得られることになった。その結果、信号出力
が、比較的低いビット伝送速度(ビットレート)で伝送
される場合においても、符号化された上で、再構成され
る信号の質が向上することとなった。
発明の例示的な実施例に従い符号化を行う、例示的な符
号化システムの伝送部分の全体図を示している。
発明の例示的な実施例に従い符号化を行う、例示的な符
号化システムの受信部分の全体図を示している。
の例示的な破裂音検出器を示している。
の例示的な出力(パワー)エンベローププロセッサーを
示している。
3の例示的な破裂音検出器のいわゆるハットハンギング
機構を示している。
の例示的な破裂音検出器のいわゆるハットハンギング機
構を示している。
って得られるlog表示の信号出力の輪郭を示してい
る。
って得られるlog表示の信号出力の輪郭及び付加され
た破裂音を示している。
補間によって得られるlog表示の信号出力の輪郭を示
している。
の補間によって得られるlog表示の信号出力の輪郭及
び付加された破裂音を示している。
ー 401 出力ステップ評価器(パワーステップエバリュ
エター) 402 アップサンプラー 403 破裂音加算器(破裂音アダー)
Claims (32)
- 【請求項1】 符号化された信号を復号化する方法に
おいて、 前記符号化された信号が、所定のパラメータについて連
続的な値を示す、符号化されたパラメータの値の信号の
配列を含み、 所定のパラメータを、符号化されたパラメータの値の信
号のうちで2つの連続的なものに基つ゛いて、複数のカ
テゴリーの一つへ分類化するステップと、 前記分類化されたカテゴリーに基つ゛いて、符号化され
たパラメータの値の信号のうちで2つの連続的なものの
間で、一回もしくはそれ以上の回数にわたって、前記所
定のパラメータの値を示す、一つもしくはそれ以上の中
間的なパラメータの値の信号を生成するステップと、を
含むことを特徴とする、符号化された信号を復号化する
方法。 - 【請求項2】 請求項1の方法において、前記符号化
された信号が符号化された音声信号を含むことを特徴と
する、符号化された信号を復号化する方法。 - 【請求項3】 請求項2の方法において、前記所定の
パラメータが音声信号の出力を表していることを特徴と
する、符号化された信号を復号化する方法。 - 【請求項4】 請求項3の方法において、前記所定の
パラメータが特徴的な波形の信号出力を表していること
を特徴とする、符号化された信号を復号化する方法。 - 【請求項5】 請求項1の方法において、前記所定の
パラメータを分類化するステップが、2つの連続的な符
号化されたパラメータの値の信号によって示された値の
間の数値上の差に基つ゛いて前記所定のパラメータを分
類化すること、を含むことを特徴とする、符号化された
信号を復号化する方法。 - 【請求項6】 請求項1の方法において、 前記カテゴリーが、直線補間のカテゴリー及びステップ
関数のカテゴリーを含み、 前記所定のパラメータが、前記直線補間のカテゴリーに
分類化されたときに、前記中間的なパラメータの値の信
号を生成するステップが、前記2つの連続的な符号化さ
れたパラメータの値の信号によって示された前記所定の
パラメータの値のうちで、数値的に、大きい方よりも小
さく、及び小さい方よりも大きい値を示す中間的なパラ
メータの値の信号を生成することを含み、 前記所定のパラメータが、前記ステップ関数のカテゴリ
ーに分類化されたときに、前記中間的なパラメータの値
の信号を生成するステップが、前記2つの連続的な符号
化されたパラメータの値の信号によって示された前記所
定のパラメータの値のうちの一つに数値的に等しい値を
示す中間的なパラメータの値の信号を生成することを含
む、ことを特徴とする、符号化された信号を復号化する
方法。 - 【請求項7】 請求項6の方法において、 前記所定のパラメータが、前記ステップ関数のカテゴリ
ーに分類化されたときに、前記中間的なパラメータの値
の信号を生成するステップが、第一の中間的なパラメー
タの値の信号と第二の中間的なパラメータの値の信号を
含む、少なくとも2つの中間的なパラメータの値の信号
を生成することを含み、 前記第一の中間的なパラメータの値の信号及び前記第二
の中間的なパラメータの値の信号が、前記所定のパラメ
ータについての異なった数値を示している、ことを特徴
とする、符号化された信号を復号化する方法。 - 【請求項8】 請求項7の方法において、前記符号化
された信号が符号化された音声信号を含み、前記所定の
パラメータが特徴的な波形の信号出力を表していること
を特徴とする、符号化された信号を復号化する方法。 - 【請求項9】 請求項1の方法において、前記符号化
された信号が、さらに、前記2つの連続的な符号化され
たパラメータの値の信号間で、幾回かにわたって、一つ
もしくはそれ以上の前記所定のパラメータの値を表して
いる、符号化されたパラメータに特徴的な信号を含んで
おり、前記分類化のステップが、前記符号化されたパラ
メータに特徴的な信号に基つ゛いて前記所定のパラメー
タを分類化することを含んでいることを特徴とする、符
号化された信号を復号化する方法。 - 【請求項10】 請求項9の方法において、前記符号化
された信号が符号化された音声信号を含むことを特徴と
する、符号化された信号を復号化する方法。 - 【請求項11】 請求項10の方法において、前記所定
のパラメータが音声信号の出力を表していることを特徴
とする、符号化された信号を復号化する方法。 - 【請求項12】 請求項11の方法において、前記複数
のカテゴリーが、音声信号の出力のうちで破裂音が存在
することを表しているカテゴリーと音声信号の出力のう
ちで破裂音が存在しないことを表しているカテゴリーを
含むことを特徴とする、符号化された信号を復号化する
方法。 - 【請求項13】 信号を符号化する方法において、当該
方法が以下のステップ、すなわち、 所定のパラメータについて連続的な値を示す、符号化さ
れたパラメータの値の信号の配列を生成し、 2つの連続する符号化されたパラメータの値の信号間
で、幾回かにわたって、一つもしくはそれ以上の前記所
定のパラメータの値に基つ゛いて、前記所定のパラメー
タを複数のカテゴリーの一つに分類化し、さらに、 前記分類化されたカテゴリーに基つ゛いて、符号化され
たパラメータに特徴的な信号を生成する、 を含むことを特徴とする、信号を符号化する方法。 - 【請求項14】 請求項13の方法において、前記信号
が音声信号を含むことを特徴とする、信号を符号化する
方法。 - 【請求項15】 請求項14の方法において、前記所定
のパラメータが音声信号の出力を表していることを特徴
とする、信号を符号化する方法。 - 【請求項16】 請求項15の方法において、前記複数
のカテゴリーが、音声信号の出力のうちで破裂音が存在
することを表しているカテゴリーと音声信号の出力のう
ちで破裂音が存在しないことを表しているカテゴリーを
含むことを特徴とする、信号を符号化する方法。 - 【請求項17】 符号化された信号を復号化するための
復号器において、符号化された信号が所定のパラメータ
について連続的な値を示している、符号化されたパラメ
ータの値の信号の配列を含んでおり、 前記復号器が、以下の手段、すなわち、 符号化されたパラメータの値の信号について、2つの連
続的なものに基つ゛いて、前記所定のパラメータを複数
のカテゴリーの一つへ分類化するための手段、 前記分類化されたカテゴリーに基つ゛いて、符号化され
たパラメータの値の信号のうちで2つの連続的なものの
間で、一回もしくはそれ以上の回数にわたって、前記所
定のパラメータの値を示す、一つもしくはそれ以上の中
間的なパラメータの値の信号を生成するための手段、 を含むことを特徴とする、符号化された信号を復号化す
るための復号器。 - 【請求項18】 請求項17の復号器において、前記符
号化された信号が、符号化された音声信号を含むことを
特徴とする、符号化された信号を復号化するための復号
器。 - 【請求項19】 請求項18の復号器において、前記所
定のパラメータが音声信号の出力を表していることを特
徴とする、符号化された信号を復号化するための復号
器。 - 【請求項20】 請求項19の復号器において、前記所
定のパラメータが特徴的な波形の信号出力を表している
ことを特徴とする、符号化された信号を復号化するため
の復号器。 - 【請求項21】 請求項17の復号器において、前記所
定のパラメータを分類化するための手段が、2つの連続
的な符号化されたパラメータの値の信号によって示され
る値の間の数値的な差に基つ゛いて、前記所定のパラメ
ータを分類化するための手段を含むことを特徴とする、
符号化された信号を復号化するための復号器。 - 【請求項22】 請求項17の復号器において、 前記カテゴリーが、直線補間のカテゴリー及びステップ
関数のカテゴリーを含み、 前記所定のパラメータが、前記直線補間のカテゴリーに
分類化されたときに、前記中間的なパラメータの値の信
号を生成するための手段が、前記2つの連続的な符号化
されたパラメータの値の信号によって示された前記所定
のパラメータの値のうちで、数値的に、大きい方よりも
小さく、及び小さい方よりも大きい値を示す中間的なパ
ラメータの値の信号を生成するための手段を含み、 前記所定のパラメータが、前記ステップ関数のカテゴリ
ーに分類化されたときに、前記中間的なパラメータの値
の信号を生成するための手段が、前記2つの連続的な符
号化されたパラメータの値の信号によって示された前記
所定のパラメータの値のうちの一つに数値的に等しい値
を示す中間的なパラメータの値の信号を生成するための
手段を含む、ことを特徴とする、符号化された信号を復
号化するための復号器。 - 【請求項23】 請求項22の復号器において、 前記所定のパラメータが、前記ステップ関数のカテゴリ
ーに分類化されたときに、前記中間的なパラメータの値
の信号を生成するための手段が、第一の中間的なパラメ
ータの値の信号と第二の中間的なパラメータの値の信号
を含む、少なくとも2つの中間的なパラメータの値の信
号を生成するための手段を含み、 前記第一の中間的なパラメータの値の信号及び前記第二
の中間的なパラメータの値の信号が、前記所定のパラメ
ータについての異なった数値を示している、ことを特徴
とする、符号化された信号を復号化するための復号器。 - 【請求項24】 請求項23の復号器において、前記符
号化された信号が符号化された音声信号を含み、前記所
定のパラメータが特徴的な波形の信号出力を表している
ことを特徴とする、符号化された信号を復号化するため
の復号器。 - 【請求項25】 請求項17の復号器において、前記符
号化された信号が、さらに、前記2つの連続的な符号化
されたパラメータの値の信号間で、幾回かにわたって、
一つもしくはそれ以上の前記所定のパラメータの値を表
している、符号化されたパラメータに特徴的な信号を含
んでおり、前記所定のパラメータを分類化するための手
段が、前記符号化されたパラメータに特徴的な信号に基
つ゛いて前記所定のパラメータを分類化するための手段
を含んでいることを特徴とする、符号化された信号を復
号化するための復号器。 - 【請求項26】 請求項25の復号器において、前記符
号化された信号が符号化された音声信号を含むことを特
徴とする、符号化された信号を復号化するための復号
器。 - 【請求項27】 請求項26の復号器において、前記所
定のパラメータが音声信号の出力を表していることを特
徴とする、符号化された信号を復号化するための復号
器。 - 【請求項28】 請求項27の復号器において、前記複
数のカテゴリーが、音声信号の出力のうちで破裂音が存
在することを表しているカテゴリーと音声信号の出力の
うちで破裂音が存在しないことを表しているカテゴリー
を含むことを特徴とする、符号化された信号を復号化す
るための復号器。 - 【請求項29】 信号を符号化する符号器において、当
該符号器が以下のステップ、すなわち、 所定のパラメータについて連続的な値を示す、符号化さ
れたパラメータの値の信号の配列を生成するための手
段、 2つの連続する符号化されたパラメータの値の信号間
で、幾回かにわたって、一つもしくはそれ以上の前記所
定のパラメータの値に基つ゛いて、前記所定のパラメー
タを複数のカテゴリーの一つに分類化するための手段、
さらに、 前記分類化されたカテゴリーに基つ゛いて、符号化され
たパラメータに特徴的な信号を生成するための手段、 を含むことを特徴とする、信号を符号化する符号器。 - 【請求項30】 請求項29の符号器において、前記信
号が音声信号を含むことを特徴とする、信号を符号化す
る符号器。 - 【請求項31】 請求項30の符号器において、前記所
定のパラメータが音声信号の出力を表していることを特
徴とする、信号を符号化する符号器。 - 【請求項32】 請求項31の符号器において、前記複
数のカテゴリーが、音声信号の出力のうちで破裂音が存
在することを表しているカテゴリーと音声信号の出力の
うちで破裂音が存在しないことを表しているカテゴリー
を含むことを特徴とする、信号を符号化する符号器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/346,798 US5839102A (en) | 1994-11-30 | 1994-11-30 | Speech coding parameter sequence reconstruction by sequence classification and interpolation |
US346798 | 1994-11-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08254994A true JPH08254994A (ja) | 1996-10-01 |
JP3489704B2 JP3489704B2 (ja) | 2004-01-26 |
Family
ID=23361091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33436795A Expired - Fee Related JP3489704B2 (ja) | 1994-11-30 | 1995-11-30 | 符号化された音声信号を復号化する方法および復号器、および音声信号を符号化する方法および符号器 |
Country Status (8)
Country | Link |
---|---|
US (1) | US5839102A (ja) |
EP (1) | EP0715297B1 (ja) |
JP (1) | JP3489704B2 (ja) |
KR (1) | KR960020012A (ja) |
CA (1) | CA2156558C (ja) |
DE (1) | DE69521272T2 (ja) |
ES (1) | ES2158052T3 (ja) |
TW (1) | TW260846B (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002525662A (ja) * | 1998-09-11 | 2002-08-13 | モトローラ・インコーポレイテッド | 遅延輪郭調整を利用して情報信号を符号化する方法および装置 |
US8014534B2 (en) | 2001-07-10 | 2011-09-06 | Coding Technologies Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US9431020B2 (en) | 2001-11-29 | 2016-08-30 | Dolby International Ab | Methods for improving high frequency reconstruction |
US9542950B2 (en) | 2002-09-18 | 2017-01-10 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6240384B1 (en) | 1995-12-04 | 2001-05-29 | Kabushiki Kaisha Toshiba | Speech synthesis method |
US6463407B2 (en) * | 1998-11-13 | 2002-10-08 | Qualcomm Inc. | Low bit-rate coding of unvoiced segments of speech |
US6453287B1 (en) * | 1999-02-04 | 2002-09-17 | Georgia-Tech Research Corporation | Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders |
WO2000060576A1 (en) * | 1999-04-05 | 2000-10-12 | Hughes Electronics Corporation | Spectral phase modeling of the prototype waveform components for a frequency domain interpolative speech codec system |
US6304842B1 (en) * | 1999-06-30 | 2001-10-16 | Glenayre Electronics, Inc. | Location and coding of unvoiced plosives in linear predictive coding of speech |
US7162415B2 (en) * | 2001-11-06 | 2007-01-09 | The Regents Of The University Of California | Ultra-narrow bandwidth voice coding |
US9058818B2 (en) * | 2009-10-22 | 2015-06-16 | Broadcom Corporation | User attribute derivation and update for network/peer assisted speech coding |
US8924200B2 (en) * | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
US8868432B2 (en) * | 2010-10-15 | 2014-10-21 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3597619A (en) * | 1965-12-23 | 1971-08-03 | Universal Drafting Machine Cor | Automatic drafting-digitizing apparatus |
US4680797A (en) * | 1984-06-26 | 1987-07-14 | The United States Of America As Represented By The Secretary Of The Air Force | Secure digital speech communication |
CA1252568A (en) * | 1984-12-24 | 1989-04-11 | Kazunori Ozawa | Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate |
US4852179A (en) * | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
JPH03160575A (ja) * | 1989-11-20 | 1991-07-10 | Toshiba Corp | 画像表示装置 |
US5355430A (en) * | 1991-08-12 | 1994-10-11 | Mechatronics Holding Ag | Method for encoding and decoding a human speech signal by using a set of parameters |
US5351338A (en) * | 1992-07-06 | 1994-09-27 | Telefonaktiebolaget L M Ericsson | Time variable spectral analysis based on interpolation for speech coding |
CA2105269C (en) * | 1992-10-09 | 1998-08-25 | Yair Shoham | Time-frequency interpolation with application to low rate speech coding |
US5416613A (en) * | 1993-10-29 | 1995-05-16 | Xerox Corporation | Color printer calibration test pattern |
US5517595A (en) * | 1994-02-08 | 1996-05-14 | At&T Corp. | Decomposition in noise and periodic signal waveforms in waveform interpolation |
-
1994
- 1994-11-30 US US08/346,798 patent/US5839102A/en not_active Expired - Lifetime
-
1995
- 1995-04-25 TW TW084104083A patent/TW260846B/zh not_active IP Right Cessation
- 1995-08-21 CA CA002156558A patent/CA2156558C/en not_active Expired - Fee Related
- 1995-11-21 DE DE69521272T patent/DE69521272T2/de not_active Expired - Lifetime
- 1995-11-21 EP EP95308359A patent/EP0715297B1/en not_active Expired - Lifetime
- 1995-11-21 ES ES95308359T patent/ES2158052T3/es not_active Expired - Lifetime
- 1995-11-29 KR KR1019950044788A patent/KR960020012A/ko not_active Application Discontinuation
- 1995-11-30 JP JP33436795A patent/JP3489704B2/ja not_active Expired - Fee Related
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002525662A (ja) * | 1998-09-11 | 2002-08-13 | モトローラ・インコーポレイテッド | 遅延輪郭調整を利用して情報信号を符号化する方法および装置 |
US8014534B2 (en) | 2001-07-10 | 2011-09-06 | Coding Technologies Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US8059826B2 (en) | 2001-07-10 | 2011-11-15 | Coding Technologies Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US8073144B2 (en) | 2001-07-10 | 2011-12-06 | Coding Technologies Ab | Stereo balance interpolation |
US8081763B2 (en) | 2001-07-10 | 2011-12-20 | Coding Technologies Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US8116460B2 (en) * | 2001-07-10 | 2012-02-14 | Coding Technologies Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US8243936B2 (en) | 2001-07-10 | 2012-08-14 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US9218818B2 (en) | 2001-07-10 | 2015-12-22 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US10902859B2 (en) | 2001-07-10 | 2021-01-26 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US10540982B2 (en) | 2001-07-10 | 2020-01-21 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US10297261B2 (en) | 2001-07-10 | 2019-05-21 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US9865271B2 (en) | 2001-07-10 | 2018-01-09 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate applications |
US9799341B2 (en) | 2001-07-10 | 2017-10-24 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate applications |
US9799340B2 (en) | 2001-07-10 | 2017-10-24 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US9792919B2 (en) | 2001-07-10 | 2017-10-17 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate applications |
US9792923B2 (en) | 2001-11-29 | 2017-10-17 | Dolby International Ab | High frequency regeneration of an audio signal with synthetic sinusoid addition |
US9761236B2 (en) | 2001-11-29 | 2017-09-12 | Dolby International Ab | High frequency regeneration of an audio signal with synthetic sinusoid addition |
US9761234B2 (en) | 2001-11-29 | 2017-09-12 | Dolby International Ab | High frequency regeneration of an audio signal with synthetic sinusoid addition |
US9812142B2 (en) | 2001-11-29 | 2017-11-07 | Dolby International Ab | High frequency regeneration of an audio signal with synthetic sinusoid addition |
US9818418B2 (en) | 2001-11-29 | 2017-11-14 | Dolby International Ab | High frequency regeneration of an audio signal with synthetic sinusoid addition |
US11238876B2 (en) | 2001-11-29 | 2022-02-01 | Dolby International Ab | Methods for improving high frequency reconstruction |
US9761237B2 (en) | 2001-11-29 | 2017-09-12 | Dolby International Ab | High frequency regeneration of an audio signal with synthetic sinusoid addition |
US9431020B2 (en) | 2001-11-29 | 2016-08-30 | Dolby International Ab | Methods for improving high frequency reconstruction |
US10403295B2 (en) | 2001-11-29 | 2019-09-03 | Dolby International Ab | Methods for improving high frequency reconstruction |
US9779746B2 (en) | 2001-11-29 | 2017-10-03 | Dolby International Ab | High frequency regeneration of an audio signal with synthetic sinusoid addition |
US10115405B2 (en) | 2002-09-18 | 2018-10-30 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US10157623B2 (en) | 2002-09-18 | 2018-12-18 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US10013991B2 (en) | 2002-09-18 | 2018-07-03 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US10418040B2 (en) | 2002-09-18 | 2019-09-17 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US9542950B2 (en) | 2002-09-18 | 2017-01-10 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US10685661B2 (en) | 2002-09-18 | 2020-06-16 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US9990929B2 (en) | 2002-09-18 | 2018-06-05 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US9842600B2 (en) | 2002-09-18 | 2017-12-12 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US11423916B2 (en) | 2002-09-18 | 2022-08-23 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
Also Published As
Publication number | Publication date |
---|---|
DE69521272T2 (de) | 2002-01-10 |
US5839102A (en) | 1998-11-17 |
CA2156558C (en) | 2001-01-16 |
EP0715297A3 (en) | 1998-01-07 |
KR960020012A (ko) | 1996-06-17 |
EP0715297B1 (en) | 2001-06-13 |
JP3489704B2 (ja) | 2004-01-26 |
DE69521272D1 (de) | 2001-07-19 |
ES2158052T3 (es) | 2001-09-01 |
TW260846B (en) | 1995-10-21 |
EP0715297A2 (en) | 1996-06-05 |
CA2156558A1 (en) | 1996-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3241959B2 (ja) | 音声信号の符号化方法 | |
JP3557662B2 (ja) | 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置 | |
US6681204B2 (en) | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal | |
US6078880A (en) | Speech coding system and method including voicing cut off frequency analyzer | |
JP3094908B2 (ja) | 音声符号化装置 | |
JP2003512654A (ja) | 音声の可変レートコーディングのための方法およびその装置 | |
JP3489704B2 (ja) | 符号化された音声信号を復号化する方法および復号器、および音声信号を符号化する方法および符号器 | |
EP1222659A1 (en) | Lpc-harmonic vocoder with superframe structure | |
JPH0353300A (ja) | 音声符号化装置 | |
JPH10307599A (ja) | スプラインを使用する波形補間音声コーディング | |
EP1597721B1 (en) | 600 bps mixed excitation linear prediction transcoding | |
JP2002268686A (ja) | 音声符号化装置及び音声復号化装置 | |
KR0155315B1 (ko) | Lsp를 이용한 celp보코더의 피치 검색방법 | |
US6535847B1 (en) | Audio signal processing | |
JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
JP4281131B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JPH07199997A (ja) | 音声信号の処理システムにおける音声信号の処理方法およびその処理における処理時間の短縮方法 | |
JPH09508479A (ja) | バースト励起線形予測 | |
US6801887B1 (en) | Speech coding exploiting the power ratio of different speech signal components | |
Rebolledo et al. | A multirate voice digitizer based upon vector quantization | |
JP3249144B2 (ja) | 音声符号化装置 | |
EP1035538B1 (en) | Multimode quantizing of the prediction residual in a speech coder | |
JP4618823B2 (ja) | 信号符号化装置及び方法 | |
EP0713208A2 (en) | Pitch lag estimation system | |
JP3192051B2 (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081107 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081107 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091107 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091107 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101107 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111107 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111107 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121107 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121107 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131107 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |