JP2003050600A - 線スペクトル平方根を発生し符号化するための方法と装置 - Google Patents
線スペクトル平方根を発生し符号化するための方法と装置Info
- Publication number
- JP2003050600A JP2003050600A JP2002140337A JP2002140337A JP2003050600A JP 2003050600 A JP2003050600 A JP 2003050600A JP 2002140337 A JP2002140337 A JP 2002140337A JP 2002140337 A JP2002140337 A JP 2002140337A JP 2003050600 A JP2003050600 A JP 2003050600A
- Authority
- JP
- Japan
- Prior art keywords
- line spectrum
- lpc
- square root
- generating
- coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 75
- 238000000034 method Methods 0.000 title claims abstract description 21
- 230000003595 spectral effect Effects 0.000 claims description 37
- 230000035945 sensitivity Effects 0.000 abstract description 37
- 239000013598 vector Substances 0.000 abstract description 25
- 238000004364 calculation method Methods 0.000 description 26
- 238000013139 quantization Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- CNQCVBJFEGMYDW-UHFFFAOYSA-N lawrencium atom Chemical compound [Lr] CNQCVBJFEGMYDW-UHFFFAOYSA-N 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- ORQBXQOJMQIAOY-UHFFFAOYSA-N nobelium Chemical compound [No] ORQBXQOJMQIAOY-UHFFFAOYSA-N 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Analogue/Digital Conversion (AREA)
Abstract
方法と装置 【解決手段】線形予測係数データを符号化する方法を教
授する。線形予測係数データを線スペクトル コサイン
データ(103)に変換する。線スペクトルコサイン
デ−タは二つの帰納的に定義されたベクトル(10
4)を発生するために使用される。帰納的に定義された
ベクトルは一組の感度自己相関値 (106a−106
N)と,一組の感度相互相関(107a−107N)を
計算するために使用される。線スペクトル コサイン値
は一組の線スペクトル平方根値を計算するために使用さ
れる。
Description
る。特に,本発明は音声符号化システムに基づいた線形
予測におけるLPC係数を符号化するための新規で改良
された方法と装置に関する。
に,長距離デイジタル無線電話への応用において広まっ
てきた。これは,チャネル上で送信された情報から再構
築された音声の品質を維持しながら,その情報量を最小
にする方法についての関心を形成してきた。もしも連続
する音声信号を単純にサンプリングし,そして各サスプ
ルを独立して量子化することにより音声を送信する場
合,再構築された音声の品質を従前のアナログ電話と同
様の品質とするためには,64キロバイト/秒程度のデ
ータ レートが要求される。しかし,適当な符号化,送
信,及び受信機における再構築が引き続き行われるとこ
ろの,通話解析を利用すると,データ レートを相当に
減少することができる。
パラメータを抽出することにより通話を圧縮する装置
は,ボコーダと呼ばれる。そのような装置は入来する音
声を解析して関連パラメータを抽出するエンコーダ,及
び送信チャネル上でエンコーダから受信したパラメータ
を利用して音声を再構築するデコーダとを具備する。音
声信号を変える時刻を正確に表すために,モデル パラ
メータは定期的に更新される。音声は,時間又は解析フ
レームのブロックに分割される。その間,パラメータは
計算され,量子化される。それらの量子化されたパラメ
ータはそれから送信チャネル上を送信され,音声は受信
機においてそれらの量子化されたパラメータから再構築
される。
ード エキサイテッド線形予測(theCode Excited Linea
r Prediction)符号化(CELP)方法が利用される。
CELP符号化アルゴリズムの例は,1988年,トーマス
イー トレメイン外による,移動衛星会議の報告,資
料「4.8kbpsコード エキサイテッド線形予測符号」
に説明されている。このタイプの特に有効なボコーダの
例は,本発明の譲受人に譲渡された,名称が「可変レー
トボコーダ」という米国特許第5,414,796号明
細書に説明されている。これはここに引用することによ
り取り込まれる。 多くの通話圧縮アルゴリズムは通話
信号のスペクトルの大きさを表すためのフイルタを使用
する。線形予測技術を使用して音声の各フレームのため
にフイルタ係数が計算されることから,該フイルタは線
形予測符号化(the Linear Predictive Coding)(LP
C)フイルタとして参照される。該フイルタ係数が決定
されると,該フイルタ係数は量子化されなければならな
い。LPCフイルタ係数を量子化するための有効な方法
は,音声信号をエンコードするのに必要なビットレート
を減少するために使用されることができる。
一つの方法は,フイルタ係数を線スペクトル対(Line sp
ectral Pair)(LSP)に変換し,該LSPパラメータ
を量子化することを含んでいる。量子化された複数のL
SPはそれからLPCフイルタ係数に戻される。それは
デコーダの音声構築モデルで使用される。LSPパラメ
ータはLPCパラメータよりもより良い量子化特性を有
し,そして量子化されたLSPパラメータのオーダリン
グ特性(the ordering property) はその結果量子化され
たLPCフイルタが安定であることを保証することか
ら,量子化はLSP領域で行われる。
一つのパラメータにおける量子化エラーは,他のLSP
パラメータ中での同様な大きさの量子化エラーにより生
起される変化に比して,LPCフイルタ応答の大きな変
化と,より大きく知覚される低下(degradation) となり
得る。量子化の知覚され得る効果は,量子化エラーに,
より敏感ではないLSPパラメータ中のより多くの量子
化エラーを許容することにより最小化されることができ
る。量子化エラーの最適分布を決定するために,各LS
Pパラメータの個々の感度を決定しなければならない。
LSPパラメータを最適に符号化するための好ましい方
法と装置は,1994年8月4日に出願され,本発明の
譲受人に譲渡された,名称が「線スペクトル ペア周波
数の,感度重みを付けられたベクトル量子化」という米
国特許出願第08/286,150号に説明されてい
る。これは,ここに引用することにより,取り込まれ
る。
(line spectral) 平方根(LSS)値を使用するLPC
パラメータを量子化するための新規で改善された方法と
装置である。 本発明は,LPC係数よりも容易に量子
化され,LSP周波数符号化の主要な利益であるところ
の量子化エラーに対して減じられた感度を提供する代替
セットのデータにLPCフイルタ係数を変換する。さら
に,LPC係数からLSS値への変換とLSS値からL
PC係数への変換は,LPC係数とLSPパラメータの
間の相当する変換よりも,より計算的なインテンシブ(i
ntensive) ではない。
測コーダ(coder) において,デイジタル化された音声サ
ンプルを受け,線形予測符号化フオーマットに従って前
記デイジタル化された音声サンプルのための一組の線形
予測符号化(LPC)係数を発生するためのLPC発生
器手段と;前記LPC係数の組を受け,線スペクトル
コサイン変換フオーマットに従って一組の線スペクトル
コサイン値を発生するための線スペクトル コサイン
発生器手段と;及び前記線スペクトルコサイン値の組を
受け,平方根変換フオーマットに従って一組の線スペク
トル平方根値を発生させるための線スペクトル平方根手
段と,ここにおいて、前記平方根変換フオーマットは,
ン値であり,yi は対応する i番目の線スペクトル平方
根値である,を具備することを特徴とする,線形予測符
号化(LPC)係数を発生し及び符号化するためのサブ
システムが提供される。この装置において,さらに、前
記線スペクトル コサイン値の組及び一組の線形予測符
号化(LPC)係数を受け,そして所定の多項式除算フ
オーマットに従って,一組の指数係数を発生させるため
の多項式除算手段と;及び前記指数係数の組と,前記線
スペクトル コサイン値の組と,及び一組の音声自己相
関を受けるための,及び重み付けられた相互相関計算フ
オーマットに従って一組の線スペクトル平方根感度係数
を計算するための感度相互相関手段と,を具備すること
が好ましい。
算手段と前記感度相互相関手段との間に配置され,前記
指数係数の組を受け,そして所定の自己相関計算フオー
マットに従って前記指数係数の組のために一組の感度自
己相関値を発生するための感度自己相関手段を具備する
ことが好ましい。この装置において,さらに,前記多項
式除算手段の前に配置され,前記LPC係数の組を受
け,そして所定のベクトル発生フオーマットに従って一
組のベクトルを発生するためのベクトル計算手段を具備
することが好ましい。
記ベクトルの組において二つのベクトルP及びQを計算
することが好ましい。
ル平方根値のために前記指数係数Ji を供することが好
ましい。
コサイン値,及びNはフイルタ タップの数である。
数線スペクトル平方根値のための前記指数係数Ji を供
することが好ましい。
コサイン値,及びNはフイルタ タップの数である。
記線スペクトル平方根感度値を供することが好ましい。
は該音声サンプルのk番目の音声自己相関係数,及びR
Ji(k) は前記指数係数の組のk 番目の自己相関係数であ
る。
ーダにおいて,デイジタル化された音声サンプルを受け
るための入力を有し,そして一組の線形予測符号化(L
PC)係数を供するための出力を有するLPC発生器
と;前記LPC発生器出力に結合された入力を有する線
スペクトル コサイン発生器と;前記線スペクトル コ
サイン発生器出力に結合された入力を有し,そして出力
を有する線スペクトル平方根発生器と,を具備するLP
C係数を発生し,符号化するためのサブシステムにおい
て、さらに、前記線スペクトル平方根発生器出力に結合
された入力を有し,及び出力を有する多項式除算計算機
と;及び前記多項式除算計算器出力に結合された入力を
有し,そして出力を有する感度相互相関計算器と,を具
備する上記サブシステムが提供される。
計算器と前記感度相互相関計算器との間に配置され,前
記多項式除算計算器出力に結合された入力を有し,及び
前記感度相互相関計算器入力に結合された出力を有する
感度自己相関計算器を具備することが好ましい。
ーダにおいて,線形予測符号化(LPC)フオーマット
に従って前記デジタル化された音声サンプルのための一
組のLPC係数を発生する工程と;線スペクトル コサ
イン変換フオーマットに従った線スペクトル コサイン
値に従って一組の線スペクトル コサイン値を発生する
工程と;及び平方根変換フオーマットに従って一組の線
スペクトル平方根値を発生させる工程と,を具備するL
PC係数を発生し、符号化するための方法において、上
記一組の線スペクトル平方根値を発生させる工程は,
り,yi は対応する i番目の線スペクトル平方根値であ
る,を備えていることを特徴とする上記方法が提供され
る。
オーマットに従って一組の指数係数を発生する工程と;
及び重み付けられた相互相関計算フオーマットに従って
一組の線スペクトル平方根感度係数を計算する工程と,
を具備することが好ましい。
フオーマットに従って前記指数係数の組のための一組の
感度自己相関値を発生する工程を具備することが好まし
い。
フオーマットに従って一組のベクトルを発生する工程を
具備することが好ましい。
る前記工程は,下記の工程を具備することが好ましい
法、
Ji を発生する工程は,下記の多項式除算を実行するこ
とが好ましい、
コサイン値,及びNはフイルタ タップの数である。
組の指数係数Ji を発生する前記ステップは,下記の多
項式除算を実行することが好ましい、
コサイン値,及びNはフイルタ タップの数である。
は、図面を参照した以下の詳細な説明からより明らかに
なるであろう。図面において、同様の参照記号は図中の
対応部分を示す。
(N))を決定することによりLPCフイルタデータを発生
し,符号化するための,及びそれらのLPC係数からL
SP周波数( ω(1),ω(2),……ω(N))を発生するため
の,従前の装置を示している。Nは,LPCフイルタ中
のフイルタ係数の数である。通話自己相関要素1は下記
式に従って,音声サンプルS(n) から一組の自己相関値
R(0) からR(N) を計算する。
サンプルの数である。典型的な実施の形態において,フ
レームでのサンプル数は160(L=160) であり,LPC
フイルタ係数の数は10(N=10)である。
相関値R(0) からR(N) のセットからLPC係数a(1)
からa(N) を計算する。LPC係数は,ダービンの反復
(Durbin's recursion)を使用する自己相関方法により得
ることができる。このことは,1978年,プレンテイ
スホール社,ラビナー及びシャアフアの音声信号のデイ
ジタル処理で議論された。このアルゴリズムは下記の式
(2)から(7)に記述されている。
ルされる。
典型的な実施の形態において,ホルマント(formant) フ
イルタは10位オーダ(tenth oeder) のフイルタであ
り,R(0) からR(10)の11自己相関値が自己相関要素
1により計算され,a(1) からa(10)の10LPC係数
がLPC計算要素2により計算される。
ω1 からωN の一組のLSP周波数に変換する。LSP
計算要素3の動作は良く知られており,前述の米国特許
第5,414,796号に詳細に記述されている。LS
P周波数を使用することの動機は,ICASSP´8
4,スーングとジュアングによる「線スペクトル対(L
SP)と音声データ圧縮」の項に与えられている。
記の式(8)と(9)に示されている。LSP周波数は
下記式の0とπの間に存在するN根(roots) である。
帰納的に定義されている。
としてスケールされた係数である。LSP周波数の特性
は,もしもLPCフイルタが安定であれば,二つのフア
ンクション代替(functions alternate) の根である。す
なわち,最とも低い根,ω1 はp(ω)の最も低い根で
あり,次に低い根,ω2 はq(ω)の最も低い根であ
る,と続く。N周波数に関して,奇数周波数はp(ω)
の根であり,偶数周波数はq(ω)の根である。
を解くことは,計算的に集約的動作(intensive operati
on) である。LPC係数をLSP周波数へ,及び逆にL
SP周波数をLPC係数に変換することにおける計算上
の負荷となる基本的ソースの一つは,三角関数の大規模
な使用の結果生じる。
りを作ることである; x=cosω (10) n>1でのcos(nω)の値は,下記の三角アイデン
ティティの帰納的な使用を通して,パワーxの結合とし
て表現することができる。
を括ることにより,式(8)と(9)は,次で与えられ
るxでの多項式に減ずることができる。
SP周波数(ω1 …ω N )により与えられる情報を供す
ることが可能である。それは線スペクトル cosines
(x1 …xN )として参照される。N線スペクトルcosi
ne値を決定することは,式(14)と(15)のN根を
見つけることを含んでいる。この手続きは三角評価を必
要とせず,計算上の複雑さを大きく減じる。LSP周波
数とは対照的に,線スペクトル コサイン値を量子化す
る際の課題は,+1と−1に近い値を持つ線スペクトル
コサイン値が量子化ノイズに非常に敏感であるという
ことである。
ン値は,線スペクトル平方根(LSS)値(y1…
yN)としてここで参照される一組の値にそれらを変換
することにより,量子化ノイズにさらに強くされる。線
スペクトル コサイン(x1…x N)値を線スペクトル
平方根(y1…yN)値に変換するために使用される計
算は,下記の式(16)に示される。
ン値であり,yi は対応した ith(i 番目の)線スペク
トル平方根値である。線スペクトル コサインs から線
スペクトル平方根への変換は線スペクトル コサインs
からLSPs ,ω=アークコサイン(x) への変換へのス
ケール近似として見ることができる。図2は式(16)
の機能の構想を示している。
線スペクトル コサイン値であるよりも,量子化ノイズ
にさらに一様に敏感であり,そしてLSP周波数への適
当な類似を持っている。しかし,LPC係数とLSS値
の間の変換は,ただ積と平方根の計算を必要とする。そ
れは,LPC係数とLSP周波数との間の変換に求めら
れる三角評価よりも計算上のインテンシブ(intensive)
は相当に少ない。
線スペクトル平方根値は計算された感度値,及びここに
記述されたコードブック選択方法と装置に従って符号化
される。線スペクトル平方根値を符号化するための方法
と装置は,最小のビット数で符号化された音声の知覚品
質を最大にする。
(1),x(2),…,x(N))と線スペクトル平方根値(S
1,S2,…SN)の量子化感度を発生するための本発
明の装置を示している。前に説明したように,NはLP
Cフイルタにおけるフイルタ係数の数である。音声自己
相関要素101は音声サンプルのフレームと上記式
(1)に従ったS(n)から,一組の自己相関値,R
(0) からR(N) を計算する。線形予測係数(LPC)計
算要素102は,式(2)から(7)で説明したよう
に,R(0) からR(N) の一組の自己相関値からLPC係
数a(1) からa(N)を計算する。線スペクトル コサイ
ン計算要素103は,式(14)から(15)で説明し
たように,一組のLPC係数を一組の線スペクトル コ
サイン値x1 からxN に変換する。感度計算要素108
は下記に示すように感度値(S1 ,…,SN )を生成す
る。
7)から(22)を使用して,LPC係数から二つの新
しいベクトル値、
5Nは,多項式除算を行い、Ji(1)からJi(N)を
有する一組の値
クトル コサイン値の指標である。奇数指標 (x1 ,
x3 , x5 など)を持つ線スペクトル コサイン値のた
めに,長い除算が下記のように実行される。
トル コサイン値のために,長い除算が下記のように行
われる。
は,ただ半分の除算を行うことが必要である。
下記の式を使用して,組Ji の自己相関を計算する。
から自己相関値と
値のための感度を計算する。この動作は、下記の式(2
8)に従って、行われる。
めの本発明の装置を示している。本発明は,ここに説明
されるような機能を奏するためにプログラムされたデイ
ジタル信号プロセッサ(DSP)において,又は特定用
途向けICにおいて,実行され得る。要素111,11
2及び113は図3のブロック101,102及び10
3のために上述したように動作する。線スペクトル コ
サイン計算要素113は線スペクトル コサイン値(x
1 …,xN )を線スペクトル平方根計算要素121に供
する。それは式(16)に従って,線スペクトル平方根
値,y(1) …y(N) を計算する。
サイン計算要素113から線スペクトル コサイン値を
受け,LPC計算要素112からLPC値(a(1),…a
(N))を受け,そして音声自己相関要素111から自己
相関値(R(0),…, R(N) )を受ける。感度計算要素1
14は,図3の感度計算要素108に関して説明したよ
うに,感度値,S1 , …, SN の組を形成する。
及び感度S1 , …… ,SN の組が計算されると,線スペ
クトル平方根値の量子化が始まる。 Δy1 , Δy2 …
……ΔyN(1)を含む,線スペクトル平方根の値差の最初
のサブベクトル(subvector)が,下記のように減算器要
素115aにより計算される。
ルのサブベクトルへの分配を定義する。N=10の典型
的な実施の形態において,線スペクトル平方根ベクトル
は,次のように,各々2つの要素の5サブベクトルへ分
配される。N(1) =2,N(2) =4,N(3) =6,N
(4) =8,N(5) =10。Vはサブベクトルの数として
定義される。典型的な実施の形態において,V=5であ
る。
平方根ベクトルは異なるデイメンションの異なる数のサ
ブベクトルに分配され得る。例えば,第一のサブベクト
ル中に3要素を,第二のサブベクトル中に3要素を,第
三のサブベクトル中に4要素を持つ3サブベクトルへの
分配は,N(1)=3,N(2)=6,及びN(3)=10となる。
この代替の実施の形態においてV=3。
ルが減算器115aで計算された後,それは要素116
a,117a,118a及び119aにより量子化され
る。要素118aは,線スペクトル平方根差ベクトルの
コードブックである。典型的な実施の形態において,6
4のそのようなベクトルがある。線スペクトル平方根差
ベクトルのコードブックは,良く知られているベクトル
量子化トレイニングアルゴリズムを使用して決定するこ
とができる。指標発生器1,要素117aはコードブッ
ク118aにコードブック指標,mを供する。指標mに
応答して,コードブック要素118aは,要素Δy
1 (m),… ,ΔyN(1)(m) により作られるm th(m番目)
コードベクトルを供する。
度重み付けエラー,E(m) を計算する。それは,線スペ
クトル平方根差の該mthコードベクトルに対する線スペ
クトル平方根差のオリジナル サブベクトルを量子化す
ることにより生起される近似スペクトルひずみを現して
いる。典型的な実施の形態において,E(m) は下記の式
により記述されるように計算される。
sitivity weighted squared errors) の合計である。式
(31)から(36)に示された感度重み付けエラーを
決定するための手順は,各線スペクトル平方根値の量子
化エラーを積算し,LSS値の感度によりそのエラーに
重み付ける。
ベクトルのために計算されると,エラー計算と最小化
(エラー計算と最小化)要素116aが指標mを選択す
る。これはW(m) を最小化する。このmの値は,コード
ブック1への選択された指標であり、I1として参照さ
れる。Δy1,‥ΔyN(1)の量子化値は
に等しくセットされる。
ベクトルにおける量子化された線スペクトル平方根値
は,次のように計算される。
yN(1)+1,ΔyN(1)+2,…ΔyN(2)を含む線スペクトル
平方根差の第二のサブベクトルを,次のように計算する
ために使用される。
ル平方根値
N(1)+1、ΔyN(1)+2、‥ΔyN(2)を含む線スペクトル平
方根差の第ニのサブベクトルを、次のように計算するた
めに使用される。
するための上記で説明したと同様な方法で行われる。
量子化される。全てのサブベクトルのための操作は,本
質的に同じであり,例えば最後のサブベクトル,Vthサ
ブベクトルは,1からV−1の全てのサブベクトルが量
子化された後で量子化される。線スペクトル平方根差の
Vthサブベクトルは,次のように要素115Vにより計
算される。
クの中でコードベクトルを見つけることにより量子化さ
れる。それは次のループにより計算される。
されると,サブベクトルのための量子化線スペクトル平
方根差と量子化線スペクトル平方根値が上記で説明した
ように計算される。この処理は,全てのサブベクトルが
量子化されるまで,連続して繰り返される。
た機能を行うための構造上のブロックとして実行される
ことができ,又は該ブロックはデイジタル信号プロッサ
のプログラミング(DSP)または特定用途向け集積回
路ASICの中で実行される機能を代表することもでき
る。本発明の機能の説明は,当業者がDSP又はASI
Cの中で過度の実験をすること無しに実行することがで
きるであろう。
が本発明を製造したり使用することができるようになさ
れている。これらの実施の形態に対する様々な変形は当
業者には自明であり,本明細書記載の包括的な原理は発
明能力を用いることなく他の実施の形態に適用される。
このため、本発明は以上に示される実施の形態に限定さ
れないが、ここに開示された原理および新規な特徴に一
貫するもっとも広範な範囲にある。
置を示すブロック図である。
るために使用される標準化機能の構想を示している。
めの感度値を発生するための装置を示しているブロック
図を示している。
体的な量子化機構を示すブロック図である。 リールの
ストックを備えるリールコンベヤーの斜視図。
Claims (3)
- 【請求項1】線形予測コーダ(coder) において,デイジ
タル化された音声サンプルを受け,線形予測符号化フオ
ーマットに従って前記デイジタル化された音声サンプル
のための一組の線形予測符号化(LPC)係数を発生す
るためのLPC発生器手段と;前記LPC係数の組を受
け,線スペクトル コサイン変換フオーマットに従って
一組の線スペクトル コサイン値を発生するための線ス
ペクトル コサイン発生器手段と;及び前記線スペクト
ル コサイン値の組を受け,平方根変換フオーマットに
従って一組の線スペクトル平方根値を発生させるための
線スペクトル平方根手段と,を具備することを特徴とす
る,線形予測符号化(LPC)係数を発生し及び符号化
するためのサブシステム。 - 【請求項2】線形予測コーダにおいて,デイジタル化さ
れた音声サンプルを受けるための入力を有し,そして一
組の線形予測符号化(LPC)係数を供するための出力
を有するLPC発生器と;前記LPC発生器出力に結合
された入力を有する線スペクトル コサイン発生器と;
前記線スペクトル コサイン発生器出力に結合された入
力を有し,そして出力を有する線スペクトル平方根発生
器と,を具備するLPC係数を発生し,符号化するため
のサブシステム。 - 【請求項3】線形予測コーダにおいて,線形予測符号化
(LPC)フオーマットに従って前記デジタル化された
音声サンプルのための一組のLPC係数を発生する工程
と;線スペクトル コサイン変換フオーマットに従った
線スペクトル コサイン値に従って一組の線スペクトル
コサイン値を発生する工程と;及び平方根変換フオー
マットに従って一組の線スペクトル平方根値を発生させ
る工程と,を具備するLPC係数を発生し、符号化する
ための方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US509,848 | 1983-06-30 | ||
US08/509,848 US5754733A (en) | 1995-08-01 | 1995-08-01 | Method and apparatus for generating and encoding line spectral square roots |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50790597A Division JP3343125B2 (ja) | 1995-08-01 | 1996-08-01 | 線スペクトル平方根を発生し符号化するための方法と装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003050600A true JP2003050600A (ja) | 2003-02-21 |
Family
ID=24028330
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50790597A Expired - Fee Related JP3343125B2 (ja) | 1995-08-01 | 1996-08-01 | 線スペクトル平方根を発生し符号化するための方法と装置 |
JP2002140337A Withdrawn JP2003050600A (ja) | 1995-08-01 | 2002-05-15 | 線スペクトル平方根を発生し符号化するための方法と装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50790597A Expired - Fee Related JP3343125B2 (ja) | 1995-08-01 | 1996-08-01 | 線スペクトル平方根を発生し符号化するための方法と装置 |
Country Status (21)
Country | Link |
---|---|
US (1) | US5754733A (ja) |
EP (1) | EP0842509B1 (ja) |
JP (2) | JP3343125B2 (ja) |
KR (1) | KR100408911B1 (ja) |
CN (1) | CN1147833C (ja) |
AR (1) | AR000436A1 (ja) |
AT (1) | ATE218740T1 (ja) |
BR (1) | BR9609841B1 (ja) |
CA (1) | CA2228172A1 (ja) |
DE (1) | DE69621620T2 (ja) |
DK (1) | DK0842509T3 (ja) |
ES (1) | ES2176478T3 (ja) |
FI (1) | FI980207A (ja) |
IL (2) | IL118977A (ja) |
MX (1) | MX9800851A (ja) |
MY (1) | MY112330A (ja) |
PT (1) | PT842509E (ja) |
RU (1) | RU98103512A (ja) |
TW (1) | TW410273B (ja) |
WO (1) | WO1997005602A1 (ja) |
ZA (1) | ZA966401B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016200750A (ja) * | 2015-04-13 | 2016-12-01 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法及びプログラム |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0821505A1 (en) * | 1996-07-25 | 1998-01-28 | Hewlett-Packard Company | Apparatus providing connectivity between devices attached to different interfaces of the apparatus |
FI973873A (fi) * | 1997-10-02 | 1999-04-03 | Nokia Mobile Phones Ltd | Puhekoodaus |
JPH11296904A (ja) | 1998-04-03 | 1999-10-29 | Toshiba Corp | 情報記録媒体およびこれに用いられる樹脂基板の製造方法 |
US7003454B2 (en) * | 2001-05-16 | 2006-02-21 | Nokia Corporation | Method and system for line spectral frequency vector quantization in speech codec |
US8352248B2 (en) * | 2003-01-03 | 2013-01-08 | Marvell International Ltd. | Speech compression method and apparatus |
US7272557B2 (en) * | 2003-05-01 | 2007-09-18 | Microsoft Corporation | Method and apparatus for quantizing model parameters |
US8920343B2 (en) | 2006-03-23 | 2014-12-30 | Michael Edward Sabatino | Apparatus for acquiring and processing of physiological auditory signals |
DE602008005250D1 (de) | 2008-01-04 | 2011-04-14 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
PL3779978T3 (pl) * | 2010-04-13 | 2022-08-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób dekodowania enkodowanego sygnału audio stereo z wykorzystaniem zmiennego kierunku predykcji |
KR101747917B1 (ko) * | 2010-10-18 | 2017-06-15 | 삼성전자주식회사 | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
MY165853A (en) * | 2011-02-14 | 2018-05-18 | Fraunhofer Ges Forschung | Linear prediction based coding scheme using spectral domain noise shaping |
PL2676264T3 (pl) | 2011-02-14 | 2015-06-30 | Fraunhofer Ges Forschung | Koder audio estymujący szum tła podczas faz aktywnych |
US9071954B2 (en) | 2011-05-31 | 2015-06-30 | Alcatel Lucent | Wireless optimized content delivery network |
US9609370B2 (en) | 2011-05-31 | 2017-03-28 | Alcatel Lucent | Video delivery modification based on network availability |
US20140358529A1 (en) * | 2013-05-29 | 2014-12-04 | Tencent Technology (Shenzhen) Company Limited | Systems, Devices and Methods for Processing Speech Signals |
EP2824661A1 (en) | 2013-07-11 | 2015-01-14 | Thomson Licensing | Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals |
EP3384893B1 (en) * | 2015-12-01 | 2022-03-09 | Bae Yong Kim | Bio-active material composite, method for preparing same and cosmetic composition containing same |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4975956A (en) * | 1989-07-26 | 1990-12-04 | Itt Corporation | Low-bit-rate speech coder using LPC data reduction processing |
US5012518A (en) * | 1989-07-26 | 1991-04-30 | Itt Corporation | Low-bit-rate speech coder using LPC data reduction processing |
CA2483322C (en) * | 1991-06-11 | 2008-09-23 | Qualcomm Incorporated | Error masking in a variable rate vocoder |
-
1995
- 1995-08-01 US US08/509,848 patent/US5754733A/en not_active Expired - Lifetime
-
1996
- 1996-07-26 ZA ZA9606401A patent/ZA966401B/xx unknown
- 1996-07-30 IL IL11897796A patent/IL118977A/xx not_active IP Right Cessation
- 1996-07-31 MY MYPI96003124A patent/MY112330A/en unknown
- 1996-07-31 AR AR33770196A patent/AR000436A1/es unknown
- 1996-08-01 EP EP96926869A patent/EP0842509B1/en not_active Expired - Lifetime
- 1996-08-01 CA CA002228172A patent/CA2228172A1/en not_active Abandoned
- 1996-08-01 JP JP50790597A patent/JP3343125B2/ja not_active Expired - Fee Related
- 1996-08-01 MX MX9800851A patent/MX9800851A/es active IP Right Grant
- 1996-08-01 ES ES96926869T patent/ES2176478T3/es not_active Expired - Lifetime
- 1996-08-01 DK DK96926869T patent/DK0842509T3/da active
- 1996-08-01 PT PT96926869T patent/PT842509E/pt unknown
- 1996-08-01 IL IL12311996A patent/IL123119A0/xx unknown
- 1996-08-01 WO PCT/US1996/012658 patent/WO1997005602A1/en active IP Right Grant
- 1996-08-01 RU RU98103512/09A patent/RU98103512A/ru not_active Application Discontinuation
- 1996-08-01 KR KR10-1998-0700709A patent/KR100408911B1/ko not_active IP Right Cessation
- 1996-08-01 BR BRPI9609841-4A patent/BR9609841B1/pt not_active IP Right Cessation
- 1996-08-01 CN CNB961967749A patent/CN1147833C/zh not_active Expired - Lifetime
- 1996-08-01 DE DE69621620T patent/DE69621620T2/de not_active Expired - Lifetime
- 1996-08-01 AT AT96926869T patent/ATE218740T1/de active
- 1996-08-14 TW TW085109891A patent/TW410273B/zh not_active IP Right Cessation
-
1998
- 1998-01-29 FI FI980207A patent/FI980207A/fi not_active IP Right Cessation
-
2002
- 2002-05-15 JP JP2002140337A patent/JP2003050600A/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016200750A (ja) * | 2015-04-13 | 2016-12-01 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
IL118977A (en) | 2000-01-31 |
IL123119A0 (en) | 1998-09-24 |
US5754733A (en) | 1998-05-19 |
DE69621620D1 (de) | 2002-07-11 |
JP3343125B2 (ja) | 2002-11-11 |
KR19990036044A (ko) | 1999-05-25 |
AU6688596A (en) | 1997-02-26 |
ZA966401B (en) | 1998-03-09 |
AR000436A1 (es) | 1997-06-18 |
EP0842509B1 (en) | 2002-06-05 |
MY112330A (en) | 2001-05-31 |
AU702506B2 (en) | 1999-02-25 |
BR9609841A (pt) | 1999-03-09 |
FI980207A (fi) | 1998-03-31 |
TW410273B (en) | 2000-11-01 |
IL118977A0 (en) | 1996-10-31 |
EP0842509A1 (en) | 1998-05-20 |
ATE218740T1 (de) | 2002-06-15 |
MX9800851A (es) | 1998-04-30 |
KR100408911B1 (ko) | 2004-04-03 |
PT842509E (pt) | 2002-10-31 |
JPH11510274A (ja) | 1999-09-07 |
WO1997005602A1 (en) | 1997-02-13 |
ES2176478T3 (es) | 2002-12-01 |
DE69621620T2 (de) | 2003-02-06 |
DK0842509T3 (da) | 2002-10-07 |
CN1147833C (zh) | 2004-04-28 |
CN1195414A (zh) | 1998-10-07 |
FI980207A0 (fi) | 1998-01-29 |
RU98103512A (ru) | 2000-01-27 |
BR9609841B1 (pt) | 2009-01-13 |
CA2228172A1 (en) | 1997-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7493256B2 (en) | Method and apparatus for high performance low bit-rate coding of unvoiced speech | |
KR100388388B1 (ko) | 재생위상정보를사용하는음성합성방법및장치 | |
EP0337636B1 (en) | Harmonic speech coding arrangement | |
US7454330B1 (en) | Method and apparatus for speech encoding and decoding by sinusoidal analysis and waveform encoding with phase reproducibility | |
RU2255380C2 (ru) | Способ и устройство воспроизведения речевых сигналов и способ их передачи | |
EP0770989B1 (en) | Speech encoding method and apparatus | |
US7299174B2 (en) | Speech coding apparatus including enhancement layer performing long term prediction | |
US6260009B1 (en) | CELP-based to CELP-based vocoder packet translation | |
US6122608A (en) | Method for switched-predictive quantization | |
US6594626B2 (en) | Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook | |
JP2003050600A (ja) | 線スペクトル平方根を発生し符号化するための方法と装置 | |
US6782359B2 (en) | Determining linear predictive coding filter parameters for encoding a voice signal | |
EP0878790A1 (en) | Voice coding system and method | |
US6532443B1 (en) | Reduced length infinite impulse response weighting | |
US6889185B1 (en) | Quantization of linear prediction coefficients using perceptual weighting | |
JPH10214100A (ja) | 音声合成方法 | |
MXPA01003150A (es) | Procedimiento de cuantificacion de los parametros de un codificador de palabras. | |
JP3237178B2 (ja) | 符号化方法及び復号化方法 | |
US5704001A (en) | Sensitivity weighted vector quantization of line spectral pair frequencies | |
US6801887B1 (en) | Speech coding exploiting the power ratio of different speech signal components | |
KR0155798B1 (ko) | 음성신호 부호화 및 복호화 방법 | |
JP3578933B2 (ja) | 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体 | |
AU702506C (en) | Method and apparatus for generating and encoding line spectral square roots | |
JP3715417B2 (ja) | 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
Nishiguchi | Weighted vector quantization of harmonic spectral magnitudes for very low-bit-rate speech coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060711 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20061011 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20061017 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070110 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070918 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20081216 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20081224 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20090907 |