JP2003050600A - 線スペクトル平方根を発生し符号化するための方法と装置 - Google Patents

線スペクトル平方根を発生し符号化するための方法と装置

Info

Publication number
JP2003050600A
JP2003050600A JP2002140337A JP2002140337A JP2003050600A JP 2003050600 A JP2003050600 A JP 2003050600A JP 2002140337 A JP2002140337 A JP 2002140337A JP 2002140337 A JP2002140337 A JP 2002140337A JP 2003050600 A JP2003050600 A JP 2003050600A
Authority
JP
Japan
Prior art keywords
line spectrum
lpc
square root
generating
coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002140337A
Other languages
English (en)
Inventor
William R Gardner
ウイリアム・アール・ガードナー
Sharath Manjunath
シャラス・マンジュナス
Peter Monta
ピーター・モンタ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2003050600A publication Critical patent/JP2003050600A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

(57)【要約】 【課題】線スペクトル平方根を発生し符号化するための
方法と装置 【解決手段】線形予測係数データを符号化する方法を教
授する。線形予測係数データを線スペクトル コサイン
データ(103)に変換する。線スペクトルコサイン
デ−タは二つの帰納的に定義されたベクトル(10
4)を発生するために使用される。帰納的に定義された
ベクトルは一組の感度自己相関値 (106a−106
N)と,一組の感度相互相関(107a−107N)を
計算するために使用される。線スペクトル コサイン値
は一組の線スペクトル平方根値を計算するために使用さ
れる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は,音声処理に関す
る。特に,本発明は音声符号化システムに基づいた線形
予測におけるLPC係数を符号化するための新規で改良
された方法と装置に関する。
【0002】
【従来の技術】デイジタル技術による音声送信は,特
に,長距離デイジタル無線電話への応用において広まっ
てきた。これは,チャネル上で送信された情報から再構
築された音声の品質を維持しながら,その情報量を最小
にする方法についての関心を形成してきた。もしも連続
する音声信号を単純にサンプリングし,そして各サスプ
ルを独立して量子化することにより音声を送信する場
合,再構築された音声の品質を従前のアナログ電話と同
様の品質とするためには,64キロバイト/秒程度のデ
ータ レートが要求される。しかし,適当な符号化,送
信,及び受信機における再構築が引き続き行われるとこ
ろの,通話解析を利用すると,データ レートを相当に
減少することができる。
【0003】人間の通話により形成されるもののモデル
パラメータを抽出することにより通話を圧縮する装置
は,ボコーダと呼ばれる。そのような装置は入来する音
声を解析して関連パラメータを抽出するエンコーダ,及
び送信チャネル上でエンコーダから受信したパラメータ
を利用して音声を再構築するデコーダとを具備する。音
声信号を変える時刻を正確に表すために,モデル パラ
メータは定期的に更新される。音声は,時間又は解析フ
レームのブロックに分割される。その間,パラメータは
計算され,量子化される。それらの量子化されたパラメ
ータはそれから送信チャネル上を送信され,音声は受信
機においてそれらの量子化されたパラメータから再構築
される。
【0004】多くの音声圧縮アルゴリズムにおいて,コ
ード エキサイテッド線形予測(theCode Excited Linea
r Prediction)符号化(CELP)方法が利用される。
CELP符号化アルゴリズムの例は,1988年,トーマス
イー トレメイン外による,移動衛星会議の報告,資
料「4.8kbpsコード エキサイテッド線形予測符号」
に説明されている。このタイプの特に有効なボコーダの
例は,本発明の譲受人に譲渡された,名称が「可変レー
トボコーダ」という米国特許第5,414,796号明
細書に説明されている。これはここに引用することによ
り取り込まれる。 多くの通話圧縮アルゴリズムは通話
信号のスペクトルの大きさを表すためのフイルタを使用
する。線形予測技術を使用して音声の各フレームのため
にフイルタ係数が計算されることから,該フイルタは線
形予測符号化(the Linear Predictive Coding)(LP
C)フイルタとして参照される。該フイルタ係数が決定
されると,該フイルタ係数は量子化されなければならな
い。LPCフイルタ係数を量子化するための有効な方法
は,音声信号をエンコードするのに必要なビットレート
を減少するために使用されることができる。
【0005】LPCフイルタの係数を量子化するための
一つの方法は,フイルタ係数を線スペクトル対(Line sp
ectral Pair)(LSP)に変換し,該LSPパラメータ
を量子化することを含んでいる。量子化された複数のL
SPはそれからLPCフイルタ係数に戻される。それは
デコーダの音声構築モデルで使用される。LSPパラメ
ータはLPCパラメータよりもより良い量子化特性を有
し,そして量子化されたLSPパラメータのオーダリン
グ特性(the ordering property) はその結果量子化され
たLPCフイルタが安定であることを保証することか
ら,量子化はLSP領域で行われる。
【0006】LSPパラメータの特別セットのために,
一つのパラメータにおける量子化エラーは,他のLSP
パラメータ中での同様な大きさの量子化エラーにより生
起される変化に比して,LPCフイルタ応答の大きな変
化と,より大きく知覚される低下(degradation) となり
得る。量子化の知覚され得る効果は,量子化エラーに,
より敏感ではないLSPパラメータ中のより多くの量子
化エラーを許容することにより最小化されることができ
る。量子化エラーの最適分布を決定するために,各LS
Pパラメータの個々の感度を決定しなければならない。
LSPパラメータを最適に符号化するための好ましい方
法と装置は,1994年8月4日に出願され,本発明の
譲受人に譲渡された,名称が「線スペクトル ペア周波
数の,感度重みを付けられたベクトル量子化」という米
国特許出願第08/286,150号に説明されてい
る。これは,ここに引用することにより,取り込まれ
る。
【0007】
【課題を解決するための手段】本発明は,線スペクトル
(line spectral) 平方根(LSS)値を使用するLPC
パラメータを量子化するための新規で改善された方法と
装置である。 本発明は,LPC係数よりも容易に量子
化され,LSP周波数符号化の主要な利益であるところ
の量子化エラーに対して減じられた感度を提供する代替
セットのデータにLPCフイルタ係数を変換する。さら
に,LPC係数からLSS値への変換とLSS値からL
PC係数への変換は,LPC係数とLSPパラメータの
間の相当する変換よりも,より計算的なインテンシブ(i
ntensive) ではない。
【0008】本願発明の一つの観点に基づいて、線形予
測コーダ(coder) において,デイジタル化された音声サ
ンプルを受け,線形予測符号化フオーマットに従って前
記デイジタル化された音声サンプルのための一組の線形
予測符号化(LPC)係数を発生するためのLPC発生
器手段と;前記LPC係数の組を受け,線スペクトル
コサイン変換フオーマットに従って一組の線スペクトル
コサイン値を発生するための線スペクトル コサイン
発生器手段と;及び前記線スペクトルコサイン値の組を
受け,平方根変換フオーマットに従って一組の線スペク
トル平方根値を発生させるための線スペクトル平方根手
段と,ここにおいて、前記平方根変換フオーマットは,
【0009】
【式1】 であり,ここで,xi は i番目の線スペクトル コサイ
ン値であり,yi は対応する i番目の線スペクトル平方
根値である,を具備することを特徴とする,線形予測符
号化(LPC)係数を発生し及び符号化するためのサブ
システムが提供される。この装置において,さらに、前
記線スペクトル コサイン値の組及び一組の線形予測符
号化(LPC)係数を受け,そして所定の多項式除算フ
オーマットに従って,一組の指数係数を発生させるため
の多項式除算手段と;及び前記指数係数の組と,前記線
スペクトル コサイン値の組と,及び一組の音声自己相
関を受けるための,及び重み付けられた相互相関計算フ
オーマットに従って一組の線スペクトル平方根感度係数
を計算するための感度相互相関手段と,を具備すること
が好ましい。
【0010】この装置において,さらに、前記多項式除
算手段と前記感度相互相関手段との間に配置され,前記
指数係数の組を受け,そして所定の自己相関計算フオー
マットに従って前記指数係数の組のために一組の感度自
己相関値を発生するための感度自己相関手段を具備する
ことが好ましい。この装置において,さらに,前記多項
式除算手段の前に配置され,前記LPC係数の組を受
け,そして所定のベクトル発生フオーマットに従って一
組のベクトルを発生するためのベクトル計算手段を具備
することが好ましい。
【0011】前記ベクトル計算手段は次の式に従って前
記ベクトルの組において二つのベクトルP及びQを計算
することが好ましい。
【0012】
【式2】 前記多項式除算手段は,次の式に従って奇数線スペクト
ル平方根値のために前記指数係数Ji を供することが好
ましい。
【0013】
【式3】 ここで,zは多項式変数,xi はi 番目の線スペクトル
コサイン値,及びNはフイルタ タップの数である。
【0014】前記多項式除算手段は,下記式に従って偶
数線スペクトル平方根値のための前記指数係数Ji を供
することが好ましい。
【0015】
【式4】 ここで,zは多項式変数,xi はi 番目の線スペクトル
コサイン値,及びNはフイルタ タップの数である。
【0016】前記感度相互相関手段は下記式に従って前
記線スペクトル平方根感度値を供することが好ましい。
【0017】
【式5】 ここで,xi はi 番目の線スペクトル平方根値,R(k)
は該音声サンプルのk番目の音声自己相関係数,及びR
Ji(k) は前記指数係数の組のk 番目の自己相関係数であ
る。
【0018】本願発明の他の観点に従って、線形予測コ
ーダにおいて,デイジタル化された音声サンプルを受け
るための入力を有し,そして一組の線形予測符号化(L
PC)係数を供するための出力を有するLPC発生器
と;前記LPC発生器出力に結合された入力を有する線
スペクトル コサイン発生器と;前記線スペクトル コ
サイン発生器出力に結合された入力を有し,そして出力
を有する線スペクトル平方根発生器と,を具備するLP
C係数を発生し,符号化するためのサブシステムにおい
て、さらに、前記線スペクトル平方根発生器出力に結合
された入力を有し,及び出力を有する多項式除算計算機
と;及び前記多項式除算計算器出力に結合された入力を
有し,そして出力を有する感度相互相関計算器と,を具
備する上記サブシステムが提供される。
【0019】このシステムは,さらに、前記多項式除算
計算器と前記感度相互相関計算器との間に配置され,前
記多項式除算計算器出力に結合された入力を有し,及び
前記感度相互相関計算器入力に結合された出力を有する
感度自己相関計算器を具備することが好ましい。
【0020】本願発明の他の観点に従って、線形予測コ
ーダにおいて,線形予測符号化(LPC)フオーマット
に従って前記デジタル化された音声サンプルのための一
組のLPC係数を発生する工程と;線スペクトル コサ
イン変換フオーマットに従った線スペクトル コサイン
値に従って一組の線スペクトル コサイン値を発生する
工程と;及び平方根変換フオーマットに従って一組の線
スペクトル平方根値を発生させる工程と,を具備するL
PC係数を発生し、符号化するための方法において、上
記一組の線スペクトル平方根値を発生させる工程は,
【0021】
【式6】 ここで,xi は i番目の線スペクトル コサイン値であ
り,yi は対応する i番目の線スペクトル平方根値であ
る,を備えていることを特徴とする上記方法が提供され
る。
【0022】この方法は,さらに、所定の多項式除算フ
オーマットに従って一組の指数係数を発生する工程と;
及び重み付けられた相互相関計算フオーマットに従って
一組の線スペクトル平方根感度係数を計算する工程と,
を具備することが好ましい。
【0023】この方法は,さらに、所定の自己相関計算
フオーマットに従って前記指数係数の組のための一組の
感度自己相関値を発生する工程を具備することが好まし
い。
【0024】この方法は,さらに、所定のベクトル発生
フオーマットに従って一組のベクトルを発生する工程を
具備することが好ましい。
【0025】この方法における一組のベクトルを発生す
る前記工程は,下記の工程を具備することが好ましい
法、
【0026】
【式7】 前記奇数線スペクトル平方根値のための一組の指数係数
i を発生する工程は,下記の多項式除算を実行するこ
とが好ましい、
【0027】
【式8】 ここで,zは多項式変数,xi はi 番目の線スペクトル
コサイン値,及びNはフイルタ タップの数である。
【0028】前記偶数線スペクトル平方根値のための一
組の指数係数Ji を発生する前記ステップは,下記の多
項式除算を実行することが好ましい、
【0029】
【式9】 ここで,zは多項式変数,xi はi 番目の線スペクトル
コサイン値,及びNはフイルタ タップの数である。
【0030】
【発明の実施の形態】本発明の特徴、目的および利点
は、図面を参照した以下の詳細な説明からより明らかに
なるであろう。図面において、同様の参照記号は図中の
対応部分を示す。
【0031】図1は,LPC係数(a(1),a(2),……,a
(N))を決定することによりLPCフイルタデータを発生
し,符号化するための,及びそれらのLPC係数からL
SP周波数( ω(1),ω(2),……ω(N))を発生するため
の,従前の装置を示している。Nは,LPCフイルタ中
のフイルタ係数の数である。通話自己相関要素1は下記
式に従って,音声サンプルS(n) から一組の自己相関値
R(0) からR(N) を計算する。
【0032】 ここで,L はLPC係数が計算されるフレームでの音声
サンプルの数である。典型的な実施の形態において,フ
レームでのサンプル数は160(L=160) であり,LPC
フイルタ係数の数は10(N=10)である。
【0033】線形予測係数(LPC)計算要素2は自己
相関値R(0) からR(N) のセットからLPC係数a(1)
からa(N) を計算する。LPC係数は,ダービンの反復
(Durbin's recursion)を使用する自己相関方法により得
ることができる。このことは,1978年,プレンテイ
スホール社,ラビナー及びシャアフアの音声信号のデイ
ジタル処理で議論された。このアルゴリズムは下記の式
(2)から(7)に記述されている。
【0034】 NLPC係数は,1Nのために,αj (10)とラベ
ルされる。
【0035】両要素1と2の動作は良く知られている。
典型的な実施の形態において,ホルマント(formant) フ
イルタは10位オーダ(tenth oeder) のフイルタであ
り,R(0) からR(10)の11自己相関値が自己相関要素
1により計算され,a(1) からa(10)の10LPC係数
がLPC計算要素2により計算される。
【0036】LSP計算要素3は一組のLPC係数を,
ω1 からωN の一組のLSP周波数に変換する。LSP
計算要素3の動作は良く知られており,前述の米国特許
第5,414,796号に詳細に記述されている。LS
P周波数を使用することの動機は,ICASSP´8
4,スーングとジュアングによる「線スペクトル対(L
SP)と音声データ圧縮」の項に与えられている。
【0037】LSPパラメータの計算は表1とともに下
記の式(8)と(9)に示されている。LSP周波数は
下記式の0とπの間に存在するN根(roots) である。
【0038】
【式10】 ここで,pn とqn 値,n =1,2…N/2,は表1に
帰納的に定義されている。
【0039】 表 1 p1=-(a(1)+a(N)))-1, q1 =-(a(1)−a(N))+1 p2=-(a(2)+a(N-1))-p1, 2 =-(a(2)−a(N-1))+q13=-(a(3) +a(N-2))-p23=-(a(3) −a(N-2))+q2 表1において,a(1),…, a(N) 値はLPC解析の結果
としてスケールされた係数である。LSP周波数の特性
は,もしもLPCフイルタが安定であれば,二つのフア
ンクション代替(functions alternate) の根である。す
なわち,最とも低い根,ω1 はp(ω)の最も低い根で
あり,次に低い根,ω2 はq(ω)の最も低い根であ
る,と続く。N周波数に関して,奇数周波数はp(ω)
の根であり,偶数周波数はq(ω)の根である。
【0040】LSP周波数を得る為に式(8)と(9)
を解くことは,計算的に集約的動作(intensive operati
on) である。LPC係数をLSP周波数へ,及び逆にL
SP周波数をLPC係数に変換することにおける計算上
の負荷となる基本的ソースの一つは,三角関数の大規模
な使用の結果生じる。
【0041】計算上の複雑さを減じる一つの路は,代わ
りを作ることである; x=cosω (10) n>1でのcos(nω)の値は,下記の三角アイデン
ティティの帰納的な使用を通して,パワーxの結合とし
て表現することができる。
【0042】 cos((n+1)ω) =2・cos(ω)cos(nω)−cos((n-1)ω) (11)このア イデンティティの延長により,次を示すことができる。
【0043】 cos(2ω)=2・cos(ω)cos(ω)−cos(0) =2x2 −1 (12) cos(3ω)=2・cos(ω)cos(2 ω)−cos(ω) =2x(2x2 −1)−x=4x3 −3x (13)と続く。
【0044】それらの代わりを作り,共通パワーxで項
を括ることにより,式(8)と(9)は,次で与えられ
るxでの多項式に減ずることができる。
【0045】
【式11】 このように,値(x1 …xN )を与えることにより,L
SP周波数(ω1 …ω N )により与えられる情報を供す
ることが可能である。それは線スペクトル cosines
(x1 …xN )として参照される。N線スペクトルcosi
ne値を決定することは,式(14)と(15)のN根を
見つけることを含んでいる。この手続きは三角評価を必
要とせず,計算上の複雑さを大きく減じる。LSP周波
数とは対照的に,線スペクトル コサイン値を量子化す
る際の課題は,+1と−1に近い値を持つ線スペクトル
コサイン値が量子化ノイズに非常に敏感であるという
ことである。
【0046】本発明においては,線スペクトル コサイ
ン値は,線スペクトル平方根(LSS)値(y
)としてここで参照される一組の値にそれらを変換
することにより,量子化ノイズにさらに強くされる。線
スペクトル コサイン(x…x )値を線スペクトル
平方根(y…y)値に変換するために使用される計
算は,下記の式(16)に示される。
【0047】
【式12】 ここで,xi は ith(i 番目の)線スペクトル コサイ
ン値であり,yi は対応した ith(i 番目の)線スペク
トル平方根値である。線スペクトル コサインs から線
スペクトル平方根への変換は線スペクトル コサインs
からLSPs ,ω=アークコサイン(x) への変換へのス
ケール近似として見ることができる。図2は式(16)
の機能の構想を示している。
【0048】この変換の故に,線スペクトル平方根値は
線スペクトル コサイン値であるよりも,量子化ノイズ
にさらに一様に敏感であり,そしてLSP周波数への適
当な類似を持っている。しかし,LPC係数とLSS値
の間の変換は,ただ積と平方根の計算を必要とする。そ
れは,LPC係数とLSP周波数との間の変換に求めら
れる三角評価よりも計算上のインテンシブ(intensive)
は相当に少ない。
【0049】本発明の改良された実施の形態において,
線スペクトル平方根値は計算された感度値,及びここに
記述されたコードブック選択方法と装置に従って符号化
される。線スペクトル平方根値を符号化するための方法
と装置は,最小のビット数で符号化された音声の知覚品
質を最大にする。
【0050】図3は,線スペクトル コサイン値(x
(1),x(2),…,x(N))と線スペクトル平方根値(S
1,S2,…SN)の量子化感度を発生するための本発
明の装置を示している。前に説明したように,NはLP
Cフイルタにおけるフイルタ係数の数である。音声自己
相関要素101は音声サンプルのフレームと上記式
(1)に従ったS(n)から,一組の自己相関値,R
(0) からR(N) を計算する。線形予測係数(LPC)計
算要素102は,式(2)から(7)で説明したよう
に,R(0) からR(N) の一組の自己相関値からLPC係
数a(1) からa(N)を計算する。線スペクトル コサイ
ン計算要素103は,式(14)から(15)で説明し
たように,一組のLPC係数を一組の線スペクトル コ
サイン値x1 からxN に変換する。感度計算要素108
は下記に示すように感度値(S1 ,…,SN )を生成す
る。
【0051】P&Q計算要素104は,下記の式(1
7)から(22)を使用して,LPC係数から二つの新
しいベクトル値、
【0052】
【式13】 P(0) =1 (17) P(N+1)=1 (18) P(i) =−a(i) −a(N+1−i) 0<i<N+1 (19) Q(0) =1 (20) Q(N+1)=−1 (21) Q(i) =−a(i) +a(N+1−i); 0<i<N+1 (22) 多項式除算(polynomial division) 要素105a−10
5Nは,多項式除算を行い、Ji(1)からJi(N)を
有する一組の値
【0053】
【式14】 を供する。ここで、iは感度値を計算するための線スペ
クトル コサイン値の指標である。奇数指標 (x1 ,
3 , x5 など)を持つ線スペクトル コサイン値のた
めに,長い除算が下記のように実行される。
【0054】
【式15】 及び偶数指標(x2 , x4 , x6 など)を持つ線スペク
トル コサイン値のために,長い除算が下記のように行
われる。
【0055】
【式16】 i が奇数の場合, Ji (K) =Ji (N+1−k) (25) この対称性の故に,全組のNJi 値を決定するために
は,ただ半分の除算を行うことが必要である。
【0056】同様に,偶数の場合, Ji (K) =−Ji (N+1−k) (26) この 反対称性の故に,ただ半分の除算を行う必要がある。
【0057】感度自己相関要素106a−106Nは,
下記の式を使用して,組Ji の自己相関を計算する。
【0058】
【式17】 感度相互相関要素107a−107Nは,
【0059】
【式18】 及び1−|Xi|による結果の重み付け(weighting)と
から自己相関値と
【0060】
【式19】 セットを相互相関することにより、線スペクトル平方根
値のための感度を計算する。この動作は、下記の式(2
8)に従って、行われる。
【0061】
【式20】 図4は線スペクトル平方根値の組を形成し量子化するた
めの本発明の装置を示している。本発明は,ここに説明
されるような機能を奏するためにプログラムされたデイ
ジタル信号プロセッサ(DSP)において,又は特定用
途向けICにおいて,実行され得る。要素111,11
2及び113は図3のブロック101,102及び10
3のために上述したように動作する。線スペクトル コ
サイン計算要素113は線スペクトル コサイン値(x
1 …,xN )を線スペクトル平方根計算要素121に供
する。それは式(16)に従って,線スペクトル平方根
値,y(1) …y(N) を計算する。
【0062】感度計算要素114は,線スペクトル コ
サイン計算要素113から線スペクトル コサイン値を
受け,LPC計算要素112からLPC値(a(1),…a
(N))を受け,そして音声自己相関要素111から自己
相関値(R(0),…, R(N) )を受ける。感度計算要素1
14は,図3の感度計算要素108に関して説明したよ
うに,感度値,S1 , …, SN の組を形成する。
【0063】線スペクトル平方根y(1) …y(N) の組,
及び感度S1 , …… ,SN の組が計算されると,線スペ
クトル平方根値の量子化が始まる。 Δy1 , Δy2
……ΔyN(1)を含む,線スペクトル平方根の値差の最初
のサブベクトル(subvector)が,下記のように減算器要
素115aにより計算される。
【0064】 Δy1 =y1 (29) Δyi =yi −yi-1 1<i<N(1) +1 (30) 値N(1),N(2) などの組は,線スペクトル平方根ベクト
ルのサブベクトルへの分配を定義する。N=10の典型
的な実施の形態において,線スペクトル平方根ベクトル
は,次のように,各々2つの要素の5サブベクトルへ分
配される。N(1) =2,N(2) =4,N(3) =6,N
(4) =8,N(5) =10。Vはサブベクトルの数として
定義される。典型的な実施の形態において,V=5であ
る。
【0065】代替の実施の形態において,線スペクトル
平方根ベクトルは異なるデイメンションの異なる数のサ
ブベクトルに分配され得る。例えば,第一のサブベクト
ル中に3要素を,第二のサブベクトル中に3要素を,第
三のサブベクトル中に4要素を持つ3サブベクトルへの
分配は,N(1)=3,N(2)=6,及びN(3)=10となる。
この代替の実施の形態においてV=3。
【0066】線スペクトル平方根差の第一のサブベクト
ルが減算器115aで計算された後,それは要素116
a,117a,118a及び119aにより量子化され
る。要素118aは,線スペクトル平方根差ベクトルの
コードブックである。典型的な実施の形態において,6
4のそのようなベクトルがある。線スペクトル平方根差
ベクトルのコードブックは,良く知られているベクトル
量子化トレイニングアルゴリズムを使用して決定するこ
とができる。指標発生器1,要素117aはコードブッ
ク118aにコードブック指標,mを供する。指標mに
応答して,コードブック要素118aは,要素Δy
1 (m),… ,ΔyN(1)(m) により作られるm th(m番目)
コードベクトルを供する。
【0067】エラー計算及び最小化要素116aは,感
度重み付けエラー,E(m) を計算する。それは,線スペ
クトル平方根差の該mthコードベクトルに対する線スペ
クトル平方根差のオリジナル サブベクトルを量子化す
ることにより生起される近似スペクトルひずみを現して
いる。典型的な実施の形態において,E(m) は下記の式
により記述されるように計算される。
【0068】 エラー=0; (31) E(m) =0; (32) k=1からN(1) に対して, (33) エラー=エラー+Δyk −Δyk (m) (34) E(m) =E(m) +Sk ェラー2 (35) ループ終了 (36) E(m) はLSS値における感度重み付け平方エラー(sen
sitivity weighted squared errors) の合計である。式
(31)から(36)に示された感度重み付けエラーを
決定するための手順は,各線スペクトル平方根値の量子
化エラーを積算し,LSS値の感度によりそのエラーに
重み付ける。
【0069】E(m) がコードブックの中の全てのコード
ベクトルのために計算されると,エラー計算と最小化
(エラー計算と最小化)要素116aが指標mを選択す
る。これはW(m) を最小化する。このmの値は,コード
ブック1への選択された指標であり、I1として参照さ
れる。Δy1,‥ΔyN(1)の量子化値は
【0070】
【式21】 により表示され、Δy1(I1),‥,ΔyN(1)(I1
に等しくセットされる。
【0071】加算器要素119aにおいて,第一のサブ
ベクトルにおける量子化された線スペクトル平方根値
は,次のように計算される。
【0072】i がN(1)+1 からN(2) であるyi は,Δ
N(1)+1,ΔyN(1)+2,…ΔyN(2)を含む線スペクトル
平方根差の第二のサブベクトルを,次のように計算する
ために使用される。
【0073】
【式22】 ブロック119aで計算された量子化された線スペクト
ル平方根値
【0074】
【式23】 と、iがN(1)+1からN(2)であるyiは、Δy
N(1)+1、ΔyN(1)+2、‥ΔyN(2)を含む線スペクトル平
方根差の第ニのサブベクトルを、次のように計算するた
めに使用される。
【0075】
【式24】 第二の指標値I2 を選択するための操作は,I1 を選択
するための上記で説明したと同様な方法で行われる。
【0076】残りのサブベクトルは同様の方法で続いて
量子化される。全てのサブベクトルのための操作は,本
質的に同じであり,例えば最後のサブベクトル,Vth
ブベクトルは,1からV−1の全てのサブベクトルが量
子化された後で量子化される。線スペクトル平方根差の
thサブベクトルは,次のように要素115Vにより計
算される。
【0077】
【式25】 thサブベクトルはE(m) を最小にするVthコードブッ
クの中でコードベクトルを見つけることにより量子化さ
れる。それは次のループにより計算される。
【0078】 エラー=0; (42) E(m) =0; (43) k =N(V−1)+1からN(V) (44) エラー=エラー+Δyk −Δyk (m) (45) E(m) =E(m) +Sk エラー (46) ループ終了 (47) Vthサブベクトルのための最善のコードベクトルが決定
されると,サブベクトルのための量子化線スペクトル平
方根差と量子化線スペクトル平方根値が上記で説明した
ように計算される。この処理は,全てのサブベクトルが
量子化されるまで,連続して繰り返される。
【0079】図3と図4において,ブロックは指定され
た機能を行うための構造上のブロックとして実行される
ことができ,又は該ブロックはデイジタル信号プロッサ
のプログラミング(DSP)または特定用途向け集積回
路ASICの中で実行される機能を代表することもでき
る。本発明の機能の説明は,当業者がDSP又はASI
Cの中で過度の実験をすること無しに実行することがで
きるであろう。
【0080】上記の好適な実施の形態の説明は、当業者
が本発明を製造したり使用することができるようになさ
れている。これらの実施の形態に対する様々な変形は当
業者には自明であり,本明細書記載の包括的な原理は発
明能力を用いることなく他の実施の形態に適用される。
このため、本発明は以上に示される実施の形態に限定さ
れないが、ここに開示された原理および新規な特徴に一
貫するもっとも広範な範囲にある。
【図面の簡単な説明】
【図1】LPC係数を発生し,符号化するための従来装
置を示すブロック図である。
【図2】本発明において線スペクトル余弦値を再分布す
るために使用される標準化機能の構想を示している。
【図3】本発明の線スペクトル平方根値を符号化するた
めの感度値を発生するための装置を示しているブロック
図を示している。
【図4】,線スペクトル平方根値を符号化するための全
体的な量子化機構を示すブロック図である。 リールの
ストックを備えるリールコンベヤーの斜視図。
【符号の説明】
108…感度計算要素,
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ウイリアム・アール・ガードナー アメリカ合衆国、カリフォルニア州 92130、サン・ディエゴ、エクスベリー・ コート 4650 (72)発明者 シャラス・マンジュナス アメリカ合衆国、カリフォルニア州 92122、サン・ディエゴ、トリー・ブルッ フ・ドライブ・ナンバー235 12682 (72)発明者 ピーター・モンタ アメリカ合衆国、カリフォルニア州 92122、サン・ディエゴ、チャーマント・ ドライブ・ナンバー624 7265 Fターム(参考) 5J064 AA01 BB01 BB03 BC01 BC12 BC27

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】線形予測コーダ(coder) において,デイジ
    タル化された音声サンプルを受け,線形予測符号化フオ
    ーマットに従って前記デイジタル化された音声サンプル
    のための一組の線形予測符号化(LPC)係数を発生す
    るためのLPC発生器手段と;前記LPC係数の組を受
    け,線スペクトル コサイン変換フオーマットに従って
    一組の線スペクトル コサイン値を発生するための線ス
    ペクトル コサイン発生器手段と;及び前記線スペクト
    ル コサイン値の組を受け,平方根変換フオーマットに
    従って一組の線スペクトル平方根値を発生させるための
    線スペクトル平方根手段と,を具備することを特徴とす
    る,線形予測符号化(LPC)係数を発生し及び符号化
    するためのサブシステム。
  2. 【請求項2】線形予測コーダにおいて,デイジタル化さ
    れた音声サンプルを受けるための入力を有し,そして一
    組の線形予測符号化(LPC)係数を供するための出力
    を有するLPC発生器と;前記LPC発生器出力に結合
    された入力を有する線スペクトル コサイン発生器と;
    前記線スペクトル コサイン発生器出力に結合された入
    力を有し,そして出力を有する線スペクトル平方根発生
    器と,を具備するLPC係数を発生し,符号化するため
    のサブシステム。
  3. 【請求項3】線形予測コーダにおいて,線形予測符号化
    (LPC)フオーマットに従って前記デジタル化された
    音声サンプルのための一組のLPC係数を発生する工程
    と;線スペクトル コサイン変換フオーマットに従った
    線スペクトル コサイン値に従って一組の線スペクトル
    コサイン値を発生する工程と;及び平方根変換フオー
    マットに従って一組の線スペクトル平方根値を発生させ
    る工程と,を具備するLPC係数を発生し、符号化する
    ための方法。
JP2002140337A 1995-08-01 2002-05-15 線スペクトル平方根を発生し符号化するための方法と装置 Withdrawn JP2003050600A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US509,848 1983-06-30
US08/509,848 US5754733A (en) 1995-08-01 1995-08-01 Method and apparatus for generating and encoding line spectral square roots

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP50790597A Division JP3343125B2 (ja) 1995-08-01 1996-08-01 線スペクトル平方根を発生し符号化するための方法と装置

Publications (1)

Publication Number Publication Date
JP2003050600A true JP2003050600A (ja) 2003-02-21

Family

ID=24028330

Family Applications (2)

Application Number Title Priority Date Filing Date
JP50790597A Expired - Fee Related JP3343125B2 (ja) 1995-08-01 1996-08-01 線スペクトル平方根を発生し符号化するための方法と装置
JP2002140337A Withdrawn JP2003050600A (ja) 1995-08-01 2002-05-15 線スペクトル平方根を発生し符号化するための方法と装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP50790597A Expired - Fee Related JP3343125B2 (ja) 1995-08-01 1996-08-01 線スペクトル平方根を発生し符号化するための方法と装置

Country Status (21)

Country Link
US (1) US5754733A (ja)
EP (1) EP0842509B1 (ja)
JP (2) JP3343125B2 (ja)
KR (1) KR100408911B1 (ja)
CN (1) CN1147833C (ja)
AR (1) AR000436A1 (ja)
AT (1) ATE218740T1 (ja)
BR (1) BR9609841B1 (ja)
CA (1) CA2228172A1 (ja)
DE (1) DE69621620T2 (ja)
DK (1) DK0842509T3 (ja)
ES (1) ES2176478T3 (ja)
FI (1) FI980207A (ja)
IL (2) IL118977A (ja)
MX (1) MX9800851A (ja)
MY (1) MY112330A (ja)
PT (1) PT842509E (ja)
RU (1) RU98103512A (ja)
TW (1) TW410273B (ja)
WO (1) WO1997005602A1 (ja)
ZA (1) ZA966401B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016200750A (ja) * 2015-04-13 2016-12-01 日本電信電話株式会社 符号化装置、復号装置、これらの方法及びプログラム

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0821505A1 (en) * 1996-07-25 1998-01-28 Hewlett-Packard Company Apparatus providing connectivity between devices attached to different interfaces of the apparatus
FI973873A (fi) * 1997-10-02 1999-04-03 Nokia Mobile Phones Ltd Puhekoodaus
JPH11296904A (ja) 1998-04-03 1999-10-29 Toshiba Corp 情報記録媒体およびこれに用いられる樹脂基板の製造方法
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
US8352248B2 (en) * 2003-01-03 2013-01-08 Marvell International Ltd. Speech compression method and apparatus
US7272557B2 (en) * 2003-05-01 2007-09-18 Microsoft Corporation Method and apparatus for quantizing model parameters
US8920343B2 (en) 2006-03-23 2014-12-30 Michael Edward Sabatino Apparatus for acquiring and processing of physiological auditory signals
DE602008005250D1 (de) 2008-01-04 2011-04-14 Dolby Sweden Ab Audiokodierer und -dekodierer
PL3779978T3 (pl) * 2010-04-13 2022-08-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób dekodowania enkodowanego sygnału audio stereo z wykorzystaniem zmiennego kierunku predykcji
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
MY165853A (en) * 2011-02-14 2018-05-18 Fraunhofer Ges Forschung Linear prediction based coding scheme using spectral domain noise shaping
PL2676264T3 (pl) 2011-02-14 2015-06-30 Fraunhofer Ges Forschung Koder audio estymujący szum tła podczas faz aktywnych
US9071954B2 (en) 2011-05-31 2015-06-30 Alcatel Lucent Wireless optimized content delivery network
US9609370B2 (en) 2011-05-31 2017-03-28 Alcatel Lucent Video delivery modification based on network availability
US20140358529A1 (en) * 2013-05-29 2014-12-04 Tencent Technology (Shenzhen) Company Limited Systems, Devices and Methods for Processing Speech Signals
EP2824661A1 (en) 2013-07-11 2015-01-14 Thomson Licensing Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
EP3384893B1 (en) * 2015-12-01 2022-03-09 Bae Yong Kim Bio-active material composite, method for preparing same and cosmetic composition containing same

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4975956A (en) * 1989-07-26 1990-12-04 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
US5012518A (en) * 1989-07-26 1991-04-30 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
CA2483322C (en) * 1991-06-11 2008-09-23 Qualcomm Incorporated Error masking in a variable rate vocoder

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016200750A (ja) * 2015-04-13 2016-12-01 日本電信電話株式会社 符号化装置、復号装置、これらの方法及びプログラム

Also Published As

Publication number Publication date
IL118977A (en) 2000-01-31
IL123119A0 (en) 1998-09-24
US5754733A (en) 1998-05-19
DE69621620D1 (de) 2002-07-11
JP3343125B2 (ja) 2002-11-11
KR19990036044A (ko) 1999-05-25
AU6688596A (en) 1997-02-26
ZA966401B (en) 1998-03-09
AR000436A1 (es) 1997-06-18
EP0842509B1 (en) 2002-06-05
MY112330A (en) 2001-05-31
AU702506B2 (en) 1999-02-25
BR9609841A (pt) 1999-03-09
FI980207A (fi) 1998-03-31
TW410273B (en) 2000-11-01
IL118977A0 (en) 1996-10-31
EP0842509A1 (en) 1998-05-20
ATE218740T1 (de) 2002-06-15
MX9800851A (es) 1998-04-30
KR100408911B1 (ko) 2004-04-03
PT842509E (pt) 2002-10-31
JPH11510274A (ja) 1999-09-07
WO1997005602A1 (en) 1997-02-13
ES2176478T3 (es) 2002-12-01
DE69621620T2 (de) 2003-02-06
DK0842509T3 (da) 2002-10-07
CN1147833C (zh) 2004-04-28
CN1195414A (zh) 1998-10-07
FI980207A0 (fi) 1998-01-29
RU98103512A (ru) 2000-01-27
BR9609841B1 (pt) 2009-01-13
CA2228172A1 (en) 1997-02-13

Similar Documents

Publication Publication Date Title
US7493256B2 (en) Method and apparatus for high performance low bit-rate coding of unvoiced speech
KR100388388B1 (ko) 재생위상정보를사용하는음성합성방법및장치
EP0337636B1 (en) Harmonic speech coding arrangement
US7454330B1 (en) Method and apparatus for speech encoding and decoding by sinusoidal analysis and waveform encoding with phase reproducibility
RU2255380C2 (ru) Способ и устройство воспроизведения речевых сигналов и способ их передачи
EP0770989B1 (en) Speech encoding method and apparatus
US7299174B2 (en) Speech coding apparatus including enhancement layer performing long term prediction
US6260009B1 (en) CELP-based to CELP-based vocoder packet translation
US6122608A (en) Method for switched-predictive quantization
US6594626B2 (en) Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook
JP2003050600A (ja) 線スペクトル平方根を発生し符号化するための方法と装置
US6782359B2 (en) Determining linear predictive coding filter parameters for encoding a voice signal
EP0878790A1 (en) Voice coding system and method
US6532443B1 (en) Reduced length infinite impulse response weighting
US6889185B1 (en) Quantization of linear prediction coefficients using perceptual weighting
JPH10214100A (ja) 音声合成方法
MXPA01003150A (es) Procedimiento de cuantificacion de los parametros de un codificador de palabras.
JP3237178B2 (ja) 符号化方法及び復号化方法
US5704001A (en) Sensitivity weighted vector quantization of line spectral pair frequencies
US6801887B1 (en) Speech coding exploiting the power ratio of different speech signal components
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
JP3578933B2 (ja) 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体
AU702506C (en) Method and apparatus for generating and encoding line spectral square roots
JP3715417B2 (ja) 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
Nishiguchi Weighted vector quantization of harmonic spectral magnitudes for very low-bit-rate speech coding

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060711

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20061011

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20061017

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070110

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070918

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20081216

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20081224

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090907