JP4460165B2 - 情報信号を符号化する方法および装置 - Google Patents
情報信号を符号化する方法および装置 Download PDFInfo
- Publication number
- JP4460165B2 JP4460165B2 JP2000570919A JP2000570919A JP4460165B2 JP 4460165 B2 JP4460165 B2 JP 4460165B2 JP 2000570919 A JP2000570919 A JP 2000570919A JP 2000570919 A JP2000570919 A JP 2000570919A JP 4460165 B2 JP4460165 B2 JP 4460165B2
- Authority
- JP
- Japan
- Prior art keywords
- pulse
- pulses
- signal
- information signal
- positions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 22
- 239000013598 vector Substances 0.000 claims description 19
- 230000005236 sound signal Effects 0.000 claims 1
- 230000005284 excitation Effects 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Paper (AREA)
- Control Of El Displays (AREA)
- Control Of Motors That Do Not Use Commutators (AREA)
Description
【産業上の利用分野】
本発明は、一般に、通信システムに関し、さらに詳しくは、かかる通信システムにおいて情報信号を符号化することに関する。
【0002】
【従来の技術】
符号分割多元接続(CDMA)通信システムは周知である。一例としてのCDMAシステムに、いわゆるIS−95があり、これは米国電気通信工業会(TIA)によって北米用として定義されている。IS−95に関する詳細については、米国電子工業会(EIA)2001 Eye Street, N.W., Washington, D.C. 206 によって1997年1月に出版された TIA/EIA/IS-95, Mobile Station-Base-station Compatibility Standard for Dual Mode Wideband Spread Spectrum Cellular Systemを参照されたい。IS−95と整合性のある通信システム用の可変レート音声コーデック、特にCELP(Code Excited Linear Prediction)コーデックは、1996年9月に出版されたEnhanced Variable Rate Codec, Speech Service Option 3 for Wideband Spread Spectrum Digital SystemsというタイトルのIS−127として知られる文書において定義されている。IS−127も、米国電子工業会(EIA) 2001 Eye Street, N.W., Washington, D.C. 2006によって出版されている。
【0003】
最新のCELPコーデックでは、低ビット・レートにて高品位な音声再生を維持することに問題がある。この問題は、CELPシンセサイザに対する刺激(stimulus)として用いられる「励起(excitation)」シーケンスまたは「コードベクトル(codevector)」を適切にモデリングするために利用可能なビットが少なすぎることに起因する。従って、従来技術の欠点を克服する改善された方法および装置が必要とされる。
【0004】
【好適な実施例の説明】
概略的にいうと、低ビット・レートにて高品位な音声復元(speech reconstruction)を実現するために、2つまたはそれ以上のパルス間の位置組合せ(position combination)に対する制約が実施される。位置組合せに対して制約を設けることにより、パルスの特定の組合せが禁止され、これが最上位のパルスを常に符号化することを可能にし、それにより音声品質が改善される。全ての有効な組合せが検討された後、一つの所定のビット長コードワードを利用してインデクスできるパルス対のリスト(コードブック; codebook)が生成される。コードワード(codeword)は宛先に送信され、ここで元の情報信号を復元するためにデコーダによって用いられる。
【0005】
具体的にいうと、情報信号を符号化する方法は、情報信号をブロックに分割する段階と、前記情報信号のブロックに基づいてターゲット信号を導出する段階とによって構成される。本方法は、与えられたパルスの許容位置は一つまたはそれ以上の他のパルスの位置に依存するところの誤差条件(error criteria)に基づいて、パルス位置決め(pulse positioning)方法を用いて前記ターゲット信号を符号化して、符号化パルス位置を生成する段階と、前記符号化パルス位置を宛先に送信する段階とをさらに含む。
【0006】
好適な実施例では、情報信号はスピーチ信号または音声信号をさらに含んで構成され、また前記情報信号のブロックは、前記情報信号のフレームまたはサブフレームをさらに含んで構成される。前記誤差条件は、知覚加重二乗誤差(perceptually weighted squared error)条件をさらに含んで構成され、また前記許容パルス位置は、任意の閉形式の式F(λ)を利用して求められ、ここでこの式内の条件のうちの少なくとも1つは、λ内の要素のうちの少なくとも2つに関連する。
【0007】
図1は、当技術分野において知られるようなCELP(Code Excited Linear Prediction)デコーダを概略的に示す。最新のCELPデコーダでは、低ビット・レートにて高品位な音声再生を維持することに問題がある。この問題は、CELPデコーダ100に対する刺激として用いられる「励起」シーケンスまたは「コードベクトル」ckを適切にモデリングするために利用可能なビットが少なすぎることに起因する。
【0008】
図1に示すように、励起シーケンスまたは「コードベクトル」ckは、適切なコードブック・インデクスkを利用して固定コードブック102(FCB:fixed codebook))から生成される。この信号は、FCB利得ファクタγを用いてスケーリングされ、そして適応型コードブック104(ACB:adaptive codebook))から出力されかつファクタβによってスケーリングされた信号E(n)と合成され、これは音声信号(周期τ)の長期的(あるいは周期的)要素をモデリングするために用いられる。全励起を表す信号Et(n)は、LPC合成フィルタ(LPC synthesis filter)106の入力として用いられ、これは一般に「フォルマント(formants)」という、粗短期的スペクトル形状(coarse short term spectral shape)をモデリングする。次に、合成フィルタ106の出力は、知覚ポストフィルタ(perceptual postfilter)108によって知覚ポストフィルタリングされ、ここで符号化歪(coding distortions)は、高音声エネルギを含む周波数にて信号スペクトルを増幅し、また低音声エネルギを含む周波数を減衰することによって、効果的に「マスク」される。さらに、全励起信号Et(n)は、合成音声の次のブロックのための適応型コードブックとして用いられる。
【0009】
図2は、CELPエンコーダ200を概略的に示す。CELPエンコーダ200内では、z変換によって一般項にて表すことができる知覚加重ターゲット信号(perceptually weighted target signal)xw(n)を符号化することを目的とする:
【0010】
【数1】
【0011】
ここで、W(z)は知覚加重フィルタ208の伝達関数であり、以下の形式である:
【0012】
【数2】
【0013】
また、H(z)は知覚加重合成フィルタ206,210の伝達関数であり、以下の形式である:
【0014】
【数3】
【0015】
ここで、A(z)は非量子化直接形式LPC係数であり、Aq(z)は量子化直接形式LPC係数であり、λ1,λ2は知覚加重係数である。さらに、HZS(z)は、フィルタ206からのH(z)の「ゼロ状態」応答であり、ここでH(z)の初期状態は全ゼロであり、またHZIR(z)はフィルタ210からのH(z)の「ゼロ入力応答」であり、ここでH(z)の直前の状態は入力励起がなくても展開することが許される。HZIR(z)の生成のために用いられる初期状態は、直前のサブフレームからの全励起Et(n)から導出される。
【0016】
xw(n)を生成するために必要なパラメータについて解を得るため、本発明による固定コードブック(FCB)閉ループ解析について説明する。ここで、コードブック・インデクスkは、知覚加重ターゲット信号xw(n)と、知覚加重励起信号
【0017】
【外1】
【0018】
との間の平均二乗誤差を最小限にするように選ばれる。これは、時間領域形式で次式のように表すことができる:
【0019】
【数4】
【0020】
ここで、ck(n)は、FCBコードブック・インデクスkに対応するコードベクトルであり、γkは、コードベクトルck(n)に関連する最適FCB利得であり、h(n)は、知覚加重合成フィルタH(z)のインパルス応答であり、Mはコードブック・サイズであり、Lはサブフレーム長であり、*は畳み込みプロセスを表し、
【0021】
【外2】
【0022】
である。好適な実施例では、音声は20ミリ秒(ms)毎に符号化され、各フレームは長さLの3つサブフレームを含む。
【0023】
数式4は、次式のようにベクトル行列形式で表すこともできる:
【0024】
【数5】
【0025】
ここで、ckおよびxwは長さLの列ベクトル(column vectors)であり、HはLxLのゼロ状態畳み込み行列である:
【0026】
【数6】
【0027】
また、Tは適切なベクトルまたは行列転置(transpose)を表す。数式5は次式に展開できる:
【0028】
【数7】
【0029】
コードベクトルckの最適コードブック利得γkは、上式の導関数(γkに関する)をゼロに設定することによって導出できる:
【0030】
【数8】
【0031】
また、γkについて解くことにより、次式が得られる:
【0032】
【数9】
【0033】
この量を数式7に導入することによって、次式が得られる:
【0034】
【数10】
【0035】
数式10の第1項はkに対して一定なので、これは次式のように表すことができる:
【0036】
【数11】
【0037】
数式11から、検索に関連する演算負担のほとんどは、kに依存しない数式11の項をあらかじめ計算する、すなわち、dT=xT wHとし、Θ=HTHとすることによって、回避できる。これを行うと、数式11は次式に整理される:
【0038】
【数12】
【0039】
これは、IS−127の式4.5.7.2−1と同等である。これらの項をあらかじめ計算するプロセスは、「バックワード・フィルタリング」として知られる。その結果、知覚加重ターゲット信号xw(n)と知覚加重励起信号
【0040】
【外3】
【0041】
との間の二乗誤差が最小となる、コードベクトルckに相当するインデクスkは、数式12の項を最大化することによって求めることができる。
【0042】
IS−127のハーフ・レートの場合(4.0kbps)、FCBはマルチパルス構成を利用し、ここで励起ベクトルckは極めてわずかな非ゼロの単位大きさ値(non-zero, unit magnitude values)しか含まない。この構成は、当技術分野ではACELP(Algebraic CELP)として知られる。ck内には極めてわずかな非ゼロ要素しかないので、数式12に伴う演算複雑さは比較的低い。IS−127の3「パルス」の場合、3つのサブフレーム(長さL=53,53,54)のそれぞれについて、パルス位置および関連する符号に対して10ビットのみが割当てられる。この構成では、関連「トラック」は、ck内の3パルスのそれぞれについて許容位置を定める(パルス当たり3ビットと、+,−,+または−,+,−の複合符号について1ビット)。IS−127の表4.5.7.4−1に示すように、パルス1は位置0,7,14,...,49を占めることができ、パルス2は位置2,9,16,...,51を占めることができ、パルス3は位置4,11,18,...,53を占めることができる。これは、「インタリーブド・パルス順列(interleaved pulse permutation)」として知られ、当技術分野で周知である。3つのパルスの位置は連携的に最適化され、そのため数式12は83=512回実行される。次に、符号ビットは、利得項γkの符号に従って設定される。
【0043】
【表1】
【0044】
表1は、IS−127レート1/2について定められるパルス位置を概略的に示す。上記のシナリオにおける一つの問題点は、励起コードベクトルckに「穴」が生じることがあり、この「穴」では特定の位置がベクトル空間によって表されないことである。すなわち、ターゲット・ベクトルに対する最適な一致は位置12におけるパルスを必要とするが、表1におけるパルス位置の定義では、パルスをこの位置に置くことができない。この位置に対する制約により、パルスは最適位置に近い位置に置かれるか、さらに悪くは、ターゲット信号のエネルギはこの位置で完全に損なわれることがある。これにより合成音声信号に歪が生じることがあり、おそらく可聴アーチファクト(audible artifacts)が生じることがある。
【0045】
同様な例において、設計条件は、4つのパルスで、4つの個別のトラックのそれぞれにおいて1つのパルスであり、サブフレーム・サイズがL=[53,53,54]で、ビット割当がサブフレーム当たり16ビットであるとする。この場合、トラックは4パルスx14位置=56全位置として構成され、これは、従来技術において用いられるようなパルス位置の例を示す表2のような従来技術に従って配置できる。ここで、16ビットのビット割当は4つのトラック間で均等に分割され、各トラックは4ビットを受ける。トラック当たり4ビットは、位置についての3ビット(8つの異なる位置をなす)と、パルスの極性を表す1つの符号ビットとによってさらに構成される。
【0046】
【表2】
【0047】
この例からわかるように、全てのパルス位置を適切に表すことができないので、依然としてベクトル空間には穴が存在する。一つの解決方法は、14個全ての位置を有効にすることであり、例えば、パルスp0の位置は[0,4,8,...,52]とし、p1は[1,5,9,...,53」などとする。この方法の問題点は、位置情報を符号化するのに4ビットを必要とし、そのためサブフレーム当たり16ビットという条件を違反することである(4トラックx(4位置ビット+1符合ビット)=20ビット)。
【0048】
従来技術において既知であるパルス符号化の別の方法は、2パルスのインデクスを一つのコードワードに多重化(multiplexing)する。例えば、IS−127レート1の場合(8.5kbps)、5つのトラックに拡散された11個の可能なパルス位置が存在する。各パルス位置について4ビットを利用せずに、7ビットのみを用いて、2パルスの位置をいっしょに符号化できる。これは、2パルスについての位置の総数が11x11=121であり、これは7ビットで符号化できる位置の総数(27=128)よりも少ないことを考慮して達成される。符号化の詳細は次式のように表すことができる:
【0049】
【数13】
【0050】
ここで、piおよびpjはi番目およびj番目のパルスの位置であり、
【外4】
は最大整数≦xを表す。
【0051】
このとき、パルス位置は次式によってデコーダにて抽出できる:
【0052】
【数14】
【0053】
ここで、λiおよびλjは、適切なトラック内の切捨て位置(decimated positions)であり、これらは表2を利用して復号でき、ここでλの値は表中の列に相当する。表2における14個の位置についてこの方法を利用することの欠点は、14x14=196位置多重化は依然として8ビット(28=256個の可能な位置)を必要とし、そのため単純にパルス当たり4ビットを利用することに比べて節約がないことである。明らかに、上記のどの従来方法でも、パルス位置の効率的な低レート符号化を可能にするベクトル空間によって全ての位置は適切に表されない。
【0054】
前述のように、効率的な16ビット,4パルス,56位置のコードブック(全ての位置を表すことが可能)の設計は、従来技術では容易に達成できない。しかし、本発明によれば、前記の例において提示された設計制約を維持しつつ、全てのパルス位置を符号化することを可能にする方法が提供される。さらに、本発明は、多様な設計制約に対して効率的な解決を可能にする柔軟性を提供する。
【0055】
本発明は、2つまたはそれ以上のパルス間の位置組合せ(position combinations)に制約を設けることによって、上記の問題を解決する。例えば、与えられたパルスの許容位置は、一つまたはそれ以上の他のパルスの関連位置に連携的に依存する。これは、図3における14位置トラックの例について見ることができ、ここで本発明によるジョイント・インタリーブド・パルス順列行列(joint interleaved pulse permutation matrix)を示す。この実施例では、図3に示す行列はパルス0,1で、サブフレーム長はL=54である。この図では、パルス0の各位置は横軸に示され、パルス1の位置は縦軸に示される。「禁止(forbidden)」パルス組合せは斜線部によって表され、許容組合せは非斜線部である。これからわかるように、非斜線部の数は、与えられたビット数によって表すことのできる組合せの数に厳密に等しく、この場合、27=128であり、また斜線部の数はパルス0の切捨て位置の総数と、パルス1の切捨て位置の総数を乗じて、それから与えられたビット数によって表すことのできる組合せの数を引いた値、すなわち、(14x14)−128=68、に厳密に等しい。
【0056】
さまざまなパルス位置コードベクトルを(数式12を介して)検索する際に、パルスp1がλ1=0(位置(0x4)+1=1)に置かれると、パルスp0の許容位置は[4,8,16,20,28,32,40,48,52]となる。同様に、パルスp1が位置5(λ1=1)に置かれると、パルスp0の許容位置は[0,8,12,20,24,32,36,44,52]となり、以下同様となる。全て有効な組合せを考慮した後、一つの7ビット・コードワードを利用してインデクスできるパルス対の128x2リスト(コードブック)が本発明に従って生成される。このコードワードは、復号および復元のために宛先に送信するのに適している。さらに、このコードブックはランタイムで代数的に生成でき、揮発性メモリ(RAM)に格納でき、あるいは不揮発性メモリ(ROM)に格納できる。
【0057】
図4は、本発明によりコードブックを生成する方法を説明するフローチャートを概略的に示す。まず最初に、フローチャートは基本的なネスト状のループ構造を示し、ここで0≦i<Mおよび0≦j<Nの全ての順列が生成される。この例では、NおよびMは各パルスについての許容位置の総数である。最も内側のループの判定は、ステップ402において、関数F(i,j)により禁止組合せ[i,j]を単純にチェックし、この関数F(i,j)は図3の例では次式のように表される:
【0058】
【数15】
【0059】
この関数は、iとjの差の絶対値が与えられたセットの要素である場合には、値1を返し、それ以外の場合には、0を返す。これは、ステップ403に示される。与えられたセットの要素は、図3の対角線の斜線部要素間の距離に相当し、従ってその式は全ての必要な斜線部を記述するのに十分である。許容パルス組合せについて、各位置は次式を用いて計算される:
【0060】
【数16】
【0061】
ここでλは切捨てトラック位置であり、Ntracksはトラックの数であり、nはトラック番号である。ステップ403においてコードブック・エントリが生成されると、コードブック・インデクスkはステップ404においてインクリメントされ、プロセスは、コードブック全体がステップ400〜401および405〜408を介して満たされるまで継続する。与えられた例のパルスp2およびp3についても、パルス位置情報を生成するために同様な方法が用いられる。
【0062】
上記の例は禁止領域が厳密に左上から右下への対角線を示しているが、128個の斜線部を用いる任意のパターンが可能であり、本発明の範囲内であると想定される。好適な実施例の別の態様は次のように説明される:全部で4x14=56個の可能なパルス位置が存在する。ただし、サブフレームの長さは54サンプル未満である。従って、53(あるいはサブフレーム1および2については52)よりも多い場所に位置を割当てることによって、符号化効率が低減し、そのため品質が劣化する。図5は、本発明によるパルスp2およびp3のジョイント・インタリーブド・パルス順列行列を概略的に示す。図5に示すように、位置54,55は斜線部によって省略されており、これにより非斜線部の総数は128のままなので、より多くの組合せを有効なベクトル空間内で表すことができる。これは、図3と図5における対角線間の相対的な間隔を比較することで把握でき、図3では禁止対角線間には2つのスペースがあり、一方図5では、3つのスペースがある。図5の禁止組合せについての閉形式の式は次にように表すことができる:
【0063】
【数17】
【0064】
これから理解されるように、図5の例は本質的に制約が少なく、従ってより高い符号化精度が得られる。
【0065】
当業者であれば理解されるように、右上から左下への対角線や、本発明に従って説明した方法を利用して特定の用途にふさわしい多数の他のパターンを形成することが可能である。さらに、任意の閉形式の式F(λ)が許容されるように、パルス数の次元を2以上に拡張することが可能であり、ここでλ=[λ0,λ1,...,λn-1]は候補パルス位置のベクトルであり、nはパルスの数である。
【0066】
本発明について特定の実施例を参照して具体的に図説してきたが、当業者であれば、形式および詳細のさまざまな変更は本発明の精神および範囲から逸脱せずに可能なことが理解されよう。特許請求項におけるすべての手段または段階の対応する構造,材料,行為および同等、ならびに機能要素は、具体的に請求される他の請求要素と組合せて機能を実行するための任意の構造,材料または行為を含むものとする。
【図面の簡単な説明】
【図1】 従来技術において知られるようなCELPデコーダを概略的に示す。
【図2】 従来技術において知られるようなCELPエンコーダを概略的に示す。
【図3】 本発明によるジョイント・インタリーブド・パルス順列行列を概略的に示す。
【図4】 本発明によりコードブックを生成する方法を説明するフローチャートを概略的に示す。
【図5】 本発明による、パルス3およびパルス4のジョイント・インタリーブド・パルス順列行列を概略的に示す。
Claims (4)
- 情報信号を符号化するコーダによって実行される方法において、
前記情報信号を前記コーダに入力する段階と、
前記情報信号を前記コーダ内で処理する段階であって、
a)前記情報信号をブロックに分割する段階、
b)前記情報信号のブロックに基づいて、ターゲット信号を導出する段階;
c)任意の閉形式の式F(λ)を利用して一組の許容パルス位置を決定する段階であって、前記式内の条件のうちの少なくとも1つは、λ内の要素の少なくとも2つに関連し、ここでλ=(λ 0 ,λ 1 ,...,λ n−1 )は候補パルスの位置ベクトルであり、nはパルス数である、段階、および
d)前記一組の許容パルス位置および誤差条件を使用して前記ターゲット信号を符号化し、符号化パルス位置を生成する段階、
によって処理する段階と、
前記符号化パルス位置を前記コーダから宛先に送信する段階と、
によって構成されることを特徴とする方法。 - 前記情報信号は、スピーチ信号または音声信号をさらに含んで構成されることを特徴とする請求項1記載の方法。
- 前記情報信号のブロックは、前記情報信号のフレームまたはサブフレームをさらに含んで構成されることを特徴とする請求項1記載の方法。
- 前記誤差条件は、知覚加重二乗誤差条件をさらに含んで構成されることを特徴とする請求項1記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15143098A | 1998-09-11 | 1998-09-11 | |
US09/151,430 | 1998-09-11 | ||
PCT/US1999/019217 WO2000016501A1 (en) | 1998-09-11 | 1999-08-24 | Method and apparatus for coding an information signal |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002525667A JP2002525667A (ja) | 2002-08-13 |
JP4460165B2 true JP4460165B2 (ja) | 2010-05-12 |
Family
ID=22538745
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000570919A Expired - Fee Related JP4460165B2 (ja) | 1998-09-11 | 1999-08-24 | 情報信号を符号化する方法および装置 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP1112625B1 (ja) |
JP (1) | JP4460165B2 (ja) |
KR (1) | KR100409167B1 (ja) |
AT (1) | ATE328407T1 (ja) |
DE (1) | DE69931641T2 (ja) |
WO (1) | WO2000016501A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6539349B1 (en) | 2000-02-15 | 2003-03-25 | Lucent Technologies Inc. | Constraining pulse positions in CELP vocoding |
US7889103B2 (en) * | 2008-03-13 | 2011-02-15 | Motorola Mobility, Inc. | Method and apparatus for low complexity combinatorial coding of signals |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2579356B1 (fr) * | 1985-03-22 | 1987-05-07 | Cit Alcatel | Procede de codage a faible debit de la parole a signal multi-impulsionnel d'excitation |
SE463691B (sv) * | 1989-05-11 | 1991-01-07 | Ericsson Telefon Ab L M | Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen |
US5754976A (en) * | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
JP3057907B2 (ja) * | 1992-06-16 | 2000-07-04 | 松下電器産業株式会社 | 音声符号化装置 |
KR950011967B1 (ko) * | 1992-07-31 | 1995-10-12 | 임홍식 | 반도체 녹음기용 메모리 정리 장치 |
JP3196595B2 (ja) * | 1995-09-27 | 2001-08-06 | 日本電気株式会社 | 音声符号化装置 |
JP4063911B2 (ja) * | 1996-02-21 | 2008-03-19 | 松下電器産業株式会社 | 音声符号化装置 |
US5970444A (en) * | 1997-03-13 | 1999-10-19 | Nippon Telegraph And Telephone Corporation | Speech coding method |
US5963897A (en) * | 1998-02-27 | 1999-10-05 | Lernout & Hauspie Speech Products N.V. | Apparatus and method for hybrid excited linear prediction speech encoding |
JP3180762B2 (ja) * | 1998-05-11 | 2001-06-25 | 日本電気株式会社 | 音声符号化装置及び音声復号化装置 |
JP3824810B2 (ja) * | 1998-09-01 | 2006-09-20 | 富士通株式会社 | 音声符号化方法、音声符号化装置、及び音声復号装置 |
-
1999
- 1999-08-24 DE DE69931641T patent/DE69931641T2/de not_active Expired - Lifetime
- 1999-08-24 EP EP99943854A patent/EP1112625B1/en not_active Expired - Lifetime
- 1999-08-24 AT AT99943854T patent/ATE328407T1/de not_active IP Right Cessation
- 1999-08-24 KR KR10-2001-7003129A patent/KR100409167B1/ko not_active IP Right Cessation
- 1999-08-24 JP JP2000570919A patent/JP4460165B2/ja not_active Expired - Fee Related
- 1999-08-24 WO PCT/US1999/019217 patent/WO2000016501A1/en active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
JP2002525667A (ja) | 2002-08-13 |
ATE328407T1 (de) | 2006-06-15 |
DE69931641D1 (de) | 2006-07-06 |
EP1112625A4 (en) | 2004-06-16 |
EP1112625A1 (en) | 2001-07-04 |
KR100409167B1 (ko) | 2003-12-12 |
KR20010073146A (ko) | 2001-07-31 |
EP1112625B1 (en) | 2006-05-31 |
WO2000016501A1 (en) | 2000-03-23 |
DE69931641T2 (de) | 2006-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7280959B2 (en) | Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals | |
KR100487943B1 (ko) | 음성 코딩 | |
JP2011050070A (ja) | 情報コード化のための階乗パッキング方法及び装置 | |
US6141638A (en) | Method and apparatus for coding an information signal | |
JP2002328700A (ja) | フレーム消去の隠蔽およびその方法 | |
AU2002221389A1 (en) | Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals | |
EP2805324B1 (en) | System and method for mixed codebook excitation for speech coding | |
CA2231925C (en) | Speech coding method | |
CA2350353A1 (en) | Relative pulse position in celp vocoding | |
US6330531B1 (en) | Comb codebook structure | |
JP3964144B2 (ja) | 入力信号をボコーディングする方法と装置 | |
JP2001154699A (ja) | フレーム消去の隠蔽及びその方法 | |
JP4460165B2 (ja) | 情報信号を符号化する方法および装置 | |
KR100416363B1 (ko) | 선형 예측 분석 대 합성 엔코딩 방법 및 엔코더 | |
KR100718487B1 (ko) | 디지털 음성 코더들에서의 고조파 잡음 가중 | |
JPH0519795A (ja) | 音声の励振信号符号化・復号化方法 | |
JP3166697B2 (ja) | 音声符号化・復号装置及びシステム | |
JPH028900A (ja) | 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置 | |
JP2853170B2 (ja) | 音声符号化復号化方式 | |
JP3128226B2 (ja) | 音声符号化方法 | |
KR100389898B1 (ko) | 음성부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법 | |
JP2775533B2 (ja) | 音声の長期予測装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060823 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090907 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20091207 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20091214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100208 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100212 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130219 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130219 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130219 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130219 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140219 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |