JP6316398B2 - Celpコーデックにおける励振信号の適応寄与分および固定寄与分の利得を量子化するための装置および方法 - Google Patents

Celpコーデックにおける励振信号の適応寄与分および固定寄与分の利得を量子化するための装置および方法 Download PDF

Info

Publication number
JP6316398B2
JP6316398B2 JP2016252938A JP2016252938A JP6316398B2 JP 6316398 B2 JP6316398 B2 JP 6316398B2 JP 2016252938 A JP2016252938 A JP 2016252938A JP 2016252938 A JP2016252938 A JP 2016252938A JP 6316398 B2 JP6316398 B2 JP 6316398B2
Authority
JP
Japan
Prior art keywords
gain
excitation signal
frame
contribution
subframe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016252938A
Other languages
English (en)
Other versions
JP2017097367A (ja
Inventor
ウラジミール・マレノフスキー
Original Assignee
ヴォイスエイジ・コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=46637577&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP6316398(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by ヴォイスエイジ・コーポレーション filed Critical ヴォイスエイジ・コーポレーション
Publication of JP2017097367A publication Critical patent/JP2017097367A/ja
Application granted granted Critical
Publication of JP6316398B2 publication Critical patent/JP6316398B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)

Description

本開示は、符号化された音信号における励振信号の固定寄与分の利得の量子化に関する。本開示はまた、励振信号の適応寄与分および固定寄与分の利得の共同量子化(joint quantization)に関する。
コーデック構造の符号器、例えばACELP(Algebraic Code-Excited Linear Prediction)のようなCELP(Code-Excited Linear Prediction、符号励振線形予測)コーデック構造では、入力音声または音響信号(音信号)を、フレームと呼ばれる短いセグメントで処理する。入力音信号の急速に変化する特性を捉えるために、各フレームはサブフレームにさらに分割される。CELPコーデック構造はまた、適応符号帳寄与分および固定符号帳寄与分を生成し、これらが加算されて全励振信号(total excitation)を形成する。励振信号の適応符号帳寄与分および固定符号帳寄与分に関連する利得が量子化され、他の符号化パラメータと併せて復号器に送信される。本文書を通して、励振信号の適応符号帳寄与分および固定符号帳寄与分を、励振信号の「適応寄与分」および「固定寄与分」と呼ぶ。
3GPP TS 26.190,「Adaptive Multi-Rate - Wideband (AMR-WB) speech codec; Transcoding functions」 MacQueen, J. B. (1967)「Some Methods for classification and Analysis of Multivariate Observations」、Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability,University of California Press, pp. 281-297 Jelinek, M., Vaillancourt, T., Gibbs, J.,「G.718: A new embedded speech and audio coding standard with high resilience to error-prone transmission channels」,In IEEE Communications Magazine,vol. 47, pp. 117-123, October 2009 J. D. Johnston,「Transform Coding of Audio Signals Using Perceptual Noise Criteria」,IEEE Journal on Selected Areas in Communications,vol. 6、no. 2,pp. 314-323,February 1988 Jelinek, M. et al.,「Advances in source-controlled variable bitrate wideband speech coding」、Special Workshop in MAUI (SWIM): Lectures by masters in speech processing, Maui,Hawaii, January 12-14, 2004
符号化パラメータを符号器から復号器に送信中に発生する可能性があるフレーム消失またはパケット損失に対するコーデックの耐性を向上させる適応励振信号寄与分および固定励振信号寄与分の利得を量子化するための技術が必要である。
第1の態様によれば、本開示は、符号化された音信号の、サブフレームを含むフレームにおける励振信号の固定寄与分の利得を量子化するための装置であって、フレームの分類を表すパラメータの入力と、フレームの分類を表すパラメータを供給される、フレームのサブフレームにおける励振信号の固定寄与分の利得の推定器と、推定利得を使用する、サブフレームにおける励振信号の固定寄与分の利得の予測量子化器とを備える装置に関する。
本開示はまた、符号化された音信号の、サブフレームを含むフレームにおける励振信号の固定寄与分の利得を量子化するための方法であって、フレームの分類を表すパラメータを受信することと、フレームの分類を表すパラメータを使用してフレームのサブフレームにおける励振信号の固定寄与分の利得を推定することと、推定利得を使用してサブフレームにおける励振信号の固定寄与分の利得を予測量子化することとを含む方法に関する。
第3の態様によれば、符号化された音信号のフレームにおける励振信号の適応寄与分および固定寄与分の利得を共同量子化するための装置であって、励振信号の適応寄与分の利得の量子化器と、励振信号の固定寄与分の利得を量子化するための上述の装置とを備える装置が提供される。
本開示はさらに、符号化された音信号のフレームにおける励振信号の適応寄与分および固定寄与分の利得を共同量子化するための方法であって、励振信号の適応寄与分の利得を量子化することと、上述の方法を使用して励振信号の固定寄与分の利得を量子化することとを含む方法に関する。
第5の態様によれば、フレームのサブフレームにおける励振信号の固定寄与分の量子化された利得を検索するための装置であって、利得符号帳のインデックスの受信機と、フレームの分類を表すパラメータを供給される、サブフレームにおける励振信号の固定寄与分の利得の推定器と、利得符号帳のインデックスに応じて補正係数を供給するための利得符号帳と、推定利得に補正係数を乗算してサブフレームにおける励振信号の固定寄与分の量子化された利得を提供する乗算器とを備える装置が提供される。
本開示はまた、フレームのサブフレームにおける励振信号の固定寄与分の量子化された利得を検索するための方法であって、利得符号帳のインデックスを受信することと、フレームの分類を表すパラメータを使用して、サブフレームにおける励振信号の固定寄与分の利得を推定することと、利得符号帳からサブフレームに対して、利得符号帳のインデックスに応じて補正係数を供給することと、推定利得に補正係数を乗算して上記サブフレームにおける励振信号の固定寄与分の量子化された利得を提供することとを含む方法に関係している。
本開示はさらに、フレームのサブフレームにおける励振信号の適応寄与分および固定寄与分の量子化された利得を検索するための装置であって、利得符号帳のインデックスの受信機と、フレームの分類を表すパラメータを供給される、サブフレームにおける励振信号の固定寄与分の利得の推定器と、利得符号帳のインデックスに応じてサブフレームに対して励振信号の適応寄与分の量子化された利得および補正係数を供給するための利得符号帳と、推定利得に補正係数を乗算してサブフレームにおける励振信号の固定寄与分の量子化された利得を提供する乗算器とを備える装置に関係している。
さらなる態様によれば、本開示は、フレームのサブフレームにおける励振信号の適応寄与分および固定寄与分の量子化された利得を検索するための方法であって、利得符号帳のインデックスを受信することと、フレームの分類を表すパラメータを使用して、サブフレームにおける励振信号の固定寄与分の利得を推定することと、利得符号帳からサブフレームに対して、利得符号帳のインデックスに応じて励振信号の適応寄与分の量子化された利得および補正係数を供給することと、推定利得に補正係数を乗算してサブフレームにおける励振信号の固定寄与分の量子化された利得を提供することとを含む方法について記載する。
前述の特徴および他の特徴は、単に添付の図面を参照して、一例として提供する例示の実施形態の次の非限定的な説明を読めば、さらに明らかになるであろう。
CELPによる符号器におけるフィルタ処理された励振信号の構築を説明する概略図である。 各フレームの第1のサブフレームにおける励振信号の固定寄与分の利得の推定器を説明する概略ブロック図である。 第1のサブフレームに続くすべてのサブフレームおける励振信号の固定寄与分の利得の推定器を説明する概略ブロック図である。 各サブフレームの利得符号帳を設計するために推定係数(estimation coefficients)が計算されて使用される状態機械を説明する概略ブロック図である。 利得量子化器を説明する概略ブロック図である。 図5の利得量子化器と等しい利得量子化器の別の実施形態の概略ブロック図である。
以下に、符号化された音信号における励振信号の固定寄与分の利得の量子化、ならびに励振信号の適応寄与分および固定寄与分の利得の共同量子化について記載する。量子化は、任意数のサブフレームに適用し、任意のサンプリング周波数で標本化された入力音声または音響信号(入力音信号)で実施することができる。また、励振信号の適応寄与分および固定寄与分の利得は、フレーム間予測を必要とすることなく量子化される。フレーム間予測をしないことにより、符号化されたパラメータの送信中に発生する恐れのあるフレーム消失またはパケット損失に対する耐性が向上する。
励振信号の適応寄与分の利得は直接に量子化されるが、励振信号の固定寄与分の利得は、推定利得を通して量子化される。励振信号の固定寄与分の利得の推定は、符号器と復号器の両方に存在するパラメータに基づく。こうしたパラメータは、現フレームの処理中に計算される。したがって、量子化または復号化の過程で前フレームからの情報は必要とされず、このため上述のように、フレーム消失に対するコーデックの耐性が向上する。
次の説明は、CELP(Code-Excited Linear Prediction)コーデック構造、例えばACELP(Algebraic Code-Excited Linear Prediction)に言及するが、本開示の対象物は、他のタイプのコーデック構造に適用できることに留意されたい。
励振信号の適応寄与分および固定寄与分の最適な非量子化利得
CELP符号化の技術では、励振信号は、2つの寄与分、すなわち適応寄与分(適応符号帳励振)および固定寄与分(固定符号帳励振)から構成される。適応符号帳は、長期予測に基づいており、したがって過去の励振信号と関連している。励振信号の適応寄与分は、ピッチラグの推定値付近の閉ループ探索によって見出される。推定ピッチラグは、相関分析によって見出される。閉ループ探索は、ターゲット信号(CELP符号化では、入力音声または音響信号(入力音信号)を知覚的にフィルタ処理されたもの)と、適応符号帳の利得でスケーリングされた励振信号のフィルタ処理済み適応寄与分との間で、平均二乗重み付き誤差(mean square weighted error、MSWE)を最小化することで構成される。閉ループ探索におけるフィルタは、CELP符号化の技術で知られている重み付けされた合成フィルタに対応する。固定符号帳探索もまた、(励振信号の適応寄与分を除去後の)更新されたターゲット信号と、固定符号帳の利得でスケーリングされた励振信号のフィルタ処理済み固定寄与分との間で平均二乗誤差(MSE)を最小化することによって実行される。フィルタ処理済み全励振信号の構築を図1に示す。さらに参考までに、CELP符号化の実行については、次の文書、3GPP TS 26.190、「Adaptive Multi-Rate - Wideband (AMR-WB) speech codec; Transcoding functions」に記載されており、その全内容を参照により本明細書に組み込む。
図1は、CELP符号化におけるフィルタ処理済み全励振信号の構築を記載する概略図である。上述のターゲット信号によって形成された入力信号101は、x(i)として示され、励振信号の適用寄与分および固定寄与分に対する利得の探索中に基準(reference)として使用される。励振信号のフィルタ処理済み適応寄与分は、y(i)として示され、励振(イノベーション(innovation))のフィルタ処理済み固定寄与分は、z(i)として示される。対応する利得は、励振信号の適応寄与分についてはgpとして、固定寄与分についてはgcとして示される。図1に示すように、増幅器104が、励振信号のフィルタ処理済み適応寄与分y(i)に利得gpを適用し、増幅器105が、励振信号のフィルタ処理済み固定寄与分z(i)にgcを適用する。ターゲット信号xiから増幅器104の出力で信号gpy(i)を減算する第1の減算器107、および減算器107からの減算の結果から増幅器105の出力で信号gcz(i)を減算する第2の減算器108を介して計算された誤差信号e(i)の平均二乗の最小化によって、最適な量子化利得を見出す。図1中のすべての信号について、インデックスiは、異なる信号サンプルを示し、0からL-1の範囲にわたり、ここでLは各サブフレームの長さである。当業者にはよく知られているように、フィルタ処理済み適応符号帳寄与分は、通常、適応符号帳励振ベクトルv(n)と、重み付き合成フィルタのインパルス応答h(n)との間の畳み込みとして計算され、すなわちy(n) = v(n)*h(n)である。同様に、フィルタ処理された固定符号帳励振信号z(n)は、z(n) = c(n)*h(n)によって求められ、ここでc(n)は固定符号帳励振信号である。
ターゲット信号x(i)、励振y(i)のフィルタ処理済み適応寄与分および励振信号z(i)のフィルタ処理済み固定寄与分がわかると仮定すると、非量子化利得gpおよびgcの最適セットは、次の関係で求められる誤差信号e(i)のエネルギを最小化することによって見出される。
e (i) = x(i) - gpy(i) - gcz(i), i = 0,…, L-1 (1)
式(1)は、次のようなベクトル形式で求めることができ、
e = x - gpy - gcz (2)
誤差信号、
Figure 0006316398
のエネルギを最小にし、ここでtは転置ベクトルを示し、最適な非量子化利得
Figure 0006316398
がもたらされ、ここで定数または相関c0, c1, c2, c3, c4およびc5は、
c0 = yty, c1 = xty, c2 = ztz, c3 = xtz, c4 = ytz, c5 = xtx (4)
のように計算される。
式(3)中の最適利得は、直接に量子化されていないが、後に説明するようにこれらは利得符号帳をトレーニング(training)する際に使用される。利得は、励振信号の固定寄与分の利得に予測を適用した後に、共同量子化される。予測は、励振信号の固定寄与分の利得の推定値gc0を計算することによって行われる。励振信号の固定寄与分の利得は、gc = gc0.γによって求められ、ここでγは補正係数である。したがって、各符号帳のエントリは、2つの値を含んでいる。第1の値は、励振信号の適応寄与分の量子化された利得gpに対応する。第2の値は、励振信号の固定寄与分の推定利得gc0に乗算するために使用される補正係数γに対応する。利得符号帳(gpおよびγ)の最適インデックスは、ターゲット信号とフィルタ処理済み全励振信号との間の平均二乗誤差を最小化することによって見出される。励振信号の固定寄与分の利得の推定について、以下に詳細に述べる。
励振信号の固定寄与分の利得の推定
各フレームは、いくつかのサブフレームを含む。フレーム中のサブフレームの数をK、現在のサブフレームのインデックスをkと示すものとする。励振信号の固定寄与分の利得の推定gc0は、各サブフレームで別々に行われる。
図2は、各フレームの第1のサブフレームにおける励振信号の固定寄与分の利得(以下、固定符号帳の利得)の推定器200を説明する概略ブロック図である。
推定器200はまず、現フレームの分類を表すパラメータtに応じて固定符号帳の利得の推定を計算する。次いで、固定符号帳からのイノベーションコードベクトルのエネルギを、推定された固定符号帳の利得から減算して、フィルタ処理済みイノベーションコードベクトルのこのエネルギを考慮に入れる。結果として生じる、推定された固定符号帳の利得に、利得符号帳から選択された補正係数を乗算して、量子化された固定符号帳の利得gcを生成する。
1つの実施形態では、推定器200は、対数領域(logarithmic domain)における固定符号帳の利得の線形推定の計算機201を備える。固定符号帳からイノベーションコードベクトル202のユニティエネルギ(unity-energy)を想定して、固定符号帳の利得を推定する。ただ1つの推定パラメータが計算機201によって使用され、パラメータtは、現フレームの分類を表す。次いで減算器203が、計算機201の出力において対数領域における線形推定された固定符号帳の利得から、対数領域における固定符号帳からのフィルタ処理済みイノベーションコードベクトル202のエネルギを減算する。変換器204が、減算器203からの対数領域の推定された固定符号帳の利得を線形領域に変換する。変換器204からの線形領域の出力は、推定された固定符号帳の利得gc0である。乗算器205が推定利得gc0に、利得符号帳から選択された補正係数206を掛ける。前節で述べたように、乗算器205の出力は、量子化された固定符号帳の利得gcとなる。
励振信号の適応寄与分の量子化された利得gp(以下、適応符号帳の利得)は、利得符号帳から直接選択される。乗算器207が、適応符号帳からのフィルタ処理済み適応励振信号208に量子化された適応符号帳の利得gpを乗算して、フィルタ処理済み励振信号のフィルタ処理済み適応寄与分209を生成する。別の乗算器210が、固定符号帳からのフィルタ処理済みイノベーションコードベクトル202に量子化された固定符号帳の利得gcを乗算して、フィルタ処理済み励振信号のフィルタ処理済み固定寄与分211を生成する。最後に、加算器212が、励振信号のフィルタ処理済み適応寄与分209と固定寄与分211とを合計して、フィルタ処理済み全励振信号214を形成する。
現フレームの第1のサブフレームでは、減算器203の出力における対数領域の推定された固定符号帳の利得は、次のように求められる。
Figure 0006316398
ただし
Figure 0006316398
式(5)の対数内の内項は、フィルタ処理済みイノベーションコードベクトル202のエネルギの平方根に対応する(Eiはフレームnの第1のサブフレームにおけるフィルタ処理済みイノベーションベクトルのエネルギである)。この内項(エネルギEiの平方根)は、フィルタ処理済みイノベーションベクトル202のエネルギEiの第1の計算機215、およびエネルギEiの平方根の計算機216によって決定される。次いで計算機217が、減算器203の負入力に適用するためにエネルギEiの平方根の対数を計算する。内項(エネルギEiの平方根)は、非ゼロのエネルギを有し、エネルギは、log(0)を回避するためにすべてゼロのフレームの場合、少量だけインクリメントされる。
計算機201における固定符号帳の利得の推定は、次の説明で述べるように、大信号データベース(トレーニング)での平均二乗の最小化によって各サブフレームに対して見出される推定係数a0およびa1を有して対数領域において線形である。式中の唯一の推定パラメータ202、tは、フレームnの分類パラメータを示す(1つの実施形態では、この値はフレームnのすべてのサブフレームに対して一定である)。フレームの分類に関する詳細を、以下に示す。最終的に、対数領域の利得の推定値は、計算機204によって元の線形領域
Figure 0006316398
に変換され、次の説明で述べるように、利得符号帳の最良のインデックスの探索処理で使用される。
上付き文字(1)は、現フレームnの第1のサブフレームを示す。
前述の記述で説明したように、現フレームの分類を表すパラメータtは、推定された固定符号帳の利得gc0の計算に使用される。音声信号の異なるクラスに対して、異なる符号帳を設計することができる。しかし、これによりメモリ必要量が増大することになる。また、第1のフレームに続くフレームにおける固定符号帳の利得の推定は、フレーム分類パラメータt、ならびに現フレーム中の前のサブフレームからの利用可能な適応符号帳の利得および固定符号帳の利得に基づくことができる。推定は、フレーム境界に限定されて、フレーム消失に対する耐性を増大させる。
例えば、フレームを、無声フレーム、有声フレーム、汎用(generic)フレーム、または遷移(transition)フレームとして分類することができる。異なる代替物を分類に使用することができる。以下に限定ではない例示的実施形態として一例を示す。さらに、音声クラスの数は、以上に使用した数とは異なる可能性がある。例えば、分類は、1つの実施形態では単に有声か、無声かとすることができる。別の実施形態では、強度に有声(strongly voiced)および強度に無声(strongly unvoiced)など、より多くの分類を追加することができる。
分類推定パラメータtの値は、任意に選択することができる。例えば、狭帯域信号については、パラメータtの値を、無声フレーム、有声フレーム、汎用フレーム、および遷移フレームに対してそれぞれ1、3、5、および7に設定し、広帯域信号については、パラメータtの値をそれぞれ0、2、4、および6に設定する。しかし、各クラスに対して推定パラメータtの他の値を使用することができる。設計において、この推定、分類パラメータtを組み込むこと、および推定パラメータを決定するためのトレーニングにより、固定符号帳の利得のより良い推定gc0がもたらされる。
フレーム中の第1のサブフレームに続くサブフレームは、わずかに異なる推定方式を使用する。その違いは、これらのサブフレームでは、現フレーム中の(1つまたは複数の)前のサブフレームからの量子化された適応符号帳の利得および量子化された固定符号帳の利得の両方を補助推定パラメータとして使用して、効率を上げることである。
図3は、現フレームの第1のサブフレームに続くサブフレームにおける固定符号帳の利得を推定するための推定器300の概略ブロック図である。推定パラメータは、分類パラメータtと、現フレームの前のサブフレームからの適応符号帳の利得および固定符号帳の利得の両方の量子化された値(パラメータ301)とを含む。こうしたパラメータ301は、gp (1)、gc (1)、gp (2)、gc (2)などと示され、ここで上付き文字は、第1のサブフレーム、第2のサブフレーム、その他の前のサブフレームを指す。固定符号帳の利得の推定を計算し、利得符号帳から選択された補正係数を乗算して、量子化された固定符号帳の利得gcを生成し、励振信号の固定寄与分の利得を形成する(この推定された固定符号帳の利得は、第1のサブフレームのものとは異なる)。
1つの実施形態では、計算機302が、再び対数領域で固定符号帳の利得の線形推定を計算し、変換器303が、この利得の推定を元の線形領域に変換する。前のサブフレームからの量子化された適応符号帳の利得gp (1)、gp (2)などは、直接計算機302に供給されるが、前のサブフレームからの量子化された固定符号帳の利得gc (1)、gc (2)などは、対数計算機304を介して対数領域で計算機302に供給される。次いで乗算器305が、変換器303からの推定された固定符号帳の利得gc0(第1のサブフレームのものとは異なる)に、利得符号帳から選択された補正係数306を乗算する。前節で述べたように、乗算器305は次に、量子化された固定符号帳の利得gcを出力し、これが励振信号の固定寄与分の利得を形成する。
第1の乗算器307が、適応符号帳からのフィルタ処理済み適応励振信号308に、利得符号帳から直接選択された量子化された適応符号帳の利得gpを乗算して、励振信号の適応寄与分309を生成する。第2の乗算器310が、固定符号帳からのフィルタ処理済みイノベーションコードベクトル311に量子化された固定符号帳の利得gcを乗算して、励振信号の固定寄与分312を生成する。加算器313が、励振信号のフィルタ処理済み適応寄与分309およびフィルタ処理済み固定寄与分312をまとめて合計し、現フレームのフィルタ処理済み全励振信号314を形成する。
対数領域で現フレームのk番目のサブフレームにおける計算機302からの推定された固定符号帳の利得は、
Figure 0006316398
によって求められ、
ここで
Figure 0006316398
は、サブフレームkの対数領域における量子化された固定符号帳の利得であり、
Figure 0006316398
は、サブフレームkにおける量子化された適応符号帳の利得である。
例えば、1つの実施形態では、4つの(4)サブフレームが使用され(K = 4)、したがって対数領域における、計算機302からの第2、第3、および第4のサブフレームの推定された固定符号帳の利得は、次の関係で求められる:
Figure 0006316398
固定符号帳の利得の上記の推定は、現フレームの前のすべてのサブフレームの量子化された適応符号帳の利得および固定符号帳の利得の両方に基づく。またこの推定方式と第1のサブフレームで使用される推定方式との間には、もう1つの違いがある。固定符号帳からのフィルタ処理済みイノベーションベクトルのエネルギは、計算機302からの対数領域において固定符号帳の利得の線形推定から減算されない。この推定方程式では前のサブフレームからの量子化された適応符号帳および固定符号帳の利得を使用するからである。第1のサブフレームでは、線形推定は、イノベーションベクトルの単位エネルギ(unit energy)を想定して計算機201によって行われる。その後、このエネルギが減算されて、推定された固定符号帳の利得をその最適値と同じエネルギレベル(または少なくともそれに近いもの)にする。第2のサブフレームおよび後続のサブフレームでは、固定符号帳の利得の前の量子化された値はすでにこのレベルであるので、フィルタ処理済みイノベーションベクトルのエネルギを考慮に入れる必要はない。推定係数aiおよびbiは、各サブフレームによって異なり、以下に説明するように、これらは大規模トレーニングデータベースを使用してオフラインで決定される。
推定係数の計算
推定係数の最適セットは、様々な言語およびレベルで、ならびに男性および女性の話者に伴って、クリーンな音声信号、雑音の多い音声信号、混合した音声信号を含む、大規模データベースで見つけられる。
推定係数は、大規模データベースで適応符号帳の利得および固定符号帳の利得の最適な非量子化値を用いてコーデックを実行することによって計算される。最適な非量子化適応符号帳の利得および最適な非量子化固定符号帳の利得は、式(3)および(4)に従って見出されることを思い出す。
次の説明では、データベースはN+1個のフレームを含み、フレームのインデックスは、n = 0,...,Nであると仮定する。フレームのインデックスnは、フレームの基準によって変わるトレーニングに使用されるパラメータ(分類、第1のサブフレームのイノベーションエネルギ、および最適な適応符号帳の利得および固定符号帳の利得)に追加される。
推定係数は、データベース中のすべてのフレームにわたって対数領域において推定固定符号帳の利得と最適利得との間の平均二乗誤差を最小にすることによって見出される。
第1のサブフレームについては、平均二乗誤差エネルギは、
Figure 0006316398
によって求められる。
式(5)から、フレームの第1のサブフレームにおける推定固定符号帳の利得は、
Figure 0006316398
によって求められる。ここで平均二乗誤差エネルギは、
Figure 0006316398
によって求められる。
上記の式(8)では、Eestは、共に対数領域の、推定固定符号帳の利得と最適な固定符号帳の利得との誤差の(データベース全体での)総エネルギである。第1のサブフレームにおける最適な、固定符号帳の利得は、g(1) c,optと示される。先の説明で述べたように、Ei(n)は、固定符号帳からのフィルタ処理済みイノベーションベクトルのエネルギであり、t(n)は、フレームnの分類パラメータである。上付き文字(1)は、第1のサブフレームを示すために使用され、nはフレームのインデックスである。
最小化の問題は、対数領域においてイノベーションベクトルの正規化された利得を定義することによって簡略化することができる。すなわち、
Figure 0006316398
である。
次に全誤差エネルギは、
Figure 0006316398
である。
上に定義したMSE(Mean Square Error、平均二乗誤差)の問題の解は、偏導関数の次のペア
Figure 0006316398
によって求められる。
上記の式の結果として得られる推定係数の最適値は、
Figure 0006316398
によって求められる。
第1のサブフレームの固定符号帳の推定は、対数領域で行われ、推定された固定符号帳の利得は、対数領域、
Figure 0006316398
においてイノベーションベクトルの正規化された利得にできる限り近いものであるべきである。
第2のサブフレームおよび他の後続サブフレームについては、推定方法はわずかに異なる。誤差エネルギは、
Figure 0006316398
によって求められ、ここで
Figure 0006316398
である。式(6)を式(12)に代入すると、以下が得られる。
Figure 0006316398
各フレームの第2のサブフレームおよび後続のサブフレームにおける推定係数の計算については、前のサブフレームの固定符号帳および適応符号帳の利得の両方の量子化された値は、上記の式(13)で使用される。最適な非量子化利得を代わりに使用することができるが、量子化された値を使用すると、すべてのサブフレームにおいて最大の推定効率をもたらし、結果として利得量子化器のより良い総合的性能をもたらす。
このように、推定係数の数は、現在のサブフレームのインデックスが進むにつれて増える。利得の量子化自体について、次の説明で述べる。推定係数aiおよびbiは、各サブフレームによって異なるが、簡略化のために同じ記号を使用した。通常これらは、関連する上付き文字(k)を有するか、またはこれらを各サブフレームによって異なるように示し、ここでkはサブフレームのインデックスである。
式(13)における誤差関数を最小化すると、次の線形方程式系
Figure 0006316398
につながる。
この系の解、すなわち推定係数の最適なセットa0、a1、b0、...、b2k-3は、複雑な公式となるので本明細書では提供しない。通常これは、線形方程式のソルバ(solver)、例えばMATLABを備えた数学ソフトウェアによって解かれる。これは有利には、オフラインで、符号化処理中でないときに行われる。
第2のサブフレームについては、式(14)は
Figure 0006316398
に低減する。
上述のように、推定係数の計算は、図4に示すように利得の量子化と交互に行われる。より詳細には、図4は、各サブフレームに対して推定係数が計算される(401)状態機械400を説明する概略ブロック図である。次いで計算された推定係数を使用して、各サブフレームに対して利得符号帳を設計する(402)。次いで、計算された推定係数および利得符号帳の設計に基づいて、サブフレームの利得量子化(403)が行われる。固定符号帳の利得自体の推定は、各サブフレームでわずかに異なり、推定係数は、最小平均二乗誤差によって見出され、利得符号帳は、例えばその全内容を参照により本明細書に組み込む、MacQueen, J. B. (1967)「Some Methods for classification and Analysis of Multivariate Observations」, Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability、University of California Press, pp. 281-297に記載されるように、KMEANSアルゴリズムを使用することによって設計することができる。
利得の量子化
図5は、利得量子化器500を説明する概略ブロック図である。
利得の量子化の前に、適応符号帳からのフィルタ処理済み適応励振信号501と固定符号帳からのフィルタ処理済みイノベーションコードベクトル502との両方がすでにわかっていると仮定する。符号器における利得の量子化は、MMSE(最小平均二乗誤差)の意味で設計された利得符号帳503を探索することによって行われる。前述の説明で述べたように、利得符号帳503中の各エントリは、2つの値、すなわち励振信号の量子化された適応符号帳の利得gpと、固定寄与分の補正係数γとを含む。固定符号帳の利得の推定は事前に行われ、推定された固定符号帳の利得gc0を使用して、利得符号帳503から選択された補正係数γに乗算する。各サブフレームでは、利得符号帳503は完全に、すなわち、Qが利得符号帳のインデックスの数であるとすると、インデックスq=0,..,Q-1について探索される。量子化された適応符号帳の利得gpが、ある閾値未満であることを要求される場合、探索領域を限定することができる。探索領域を削減できるようにするために、適応符号帳の利得gpの値に従って符号帳のエントリを昇べきの順にソートすることができる。
図5を参照すると、2つのエントリの利得符号帳503が探索され、各インデックスが2つの値、すなわち適応符号帳の利得gpと補正係数γとを提供している。乗算器504が、補正係数γに推定された固定符号帳の利得gc0を乗算し、結果として生じる値を励振信号の固定寄与分の量子化された利得505(量子化された固定符号帳の利得)として使用する。別の乗算器506が、適応符号帳からのフィルタ処理済み適応励振信号501に、利得符号帳503からの量子化された適応符号帳の利得gpを乗算して、励振信号の適応寄与分507を生成する。乗算器508が、フィルタ処理済みイノベーションコードベクトル502に、量子化された固定符号帳の利得505を乗算して、励振信号の固定寄与分509を生成する。加算器510が、励振信号の適応寄与分507と固定寄与分509をまとめて合計し、フィルタ処理済み全励振信号511を形成する。減算器512が、ターゲット信号xiからフィルタ処理済み全励振信号511を減算して、誤差信号eiを生成する。計算機513は、誤差信号eiのエネルギ515を計算し、これを利得符号帳探索機構に戻す。利得符号帳503のインデックスの全部または一部がこのように探索され、最低誤差エネルギ515を生じる利得符号帳503のインデックスが獲得インデックス(winning index)として選択され、復号器に送信される。
利得の量子化は、式(2)中の誤差のエネルギを最小化することによって行うことができる。このエネルギは、以下によって求められる。
E = ete = (x - gpy - gcz)t(x - gpy - gcz) (15)
gcをγgc0に置き換えると、次の関係が得られる。
Figure 0006316398
ここで定数または相関c0、c1、c2、c3、c4、およびc5は、上記の式(4)のように計算される。定数または相関c0、c1、c2、c3、c4およびc5、ならびに推定利得gc0は、利得符号帳503の探索前に計算され、次いで式(16)のエネルギが、各符号帳のインデックスに対して計算される(エントリの値gpおよびγの各セット)。
誤差信号eiの最低エネルギ515につながる利得符号帳503からのコードベクトルは、獲得コードベクトルとして選択され、そのエントリの値が、量子化された値gpおよびγに対応する。次いで固定符号帳の利得の量子化された値は、以下のように計算される。
gc = gc0・γ
図6は、式(16)を使用して誤差信号eiのエネルギEiの計算を行う、図5中と等価の利得量子化器600の概略ブロック図である。より詳細には、利得量子化器600は、利得符号帳601と、定数または相関の計算機602と、誤差信号のエネルギ604の計算機603とを備える。計算機602は、式(4)、ならびにターゲットベクトルx、適応符号帳からのフィルタ処理済み適応励振信号ベクトルy、および固定符号帳からのフィルタ処理済み固定コードベクトルzを使用して、定数または相関c0、c1、c2、c3、c4およびc5を計算する。ここでtは転置ベクトルを示す。計算機603は、式(16)を使用して、推定された固定符号帳の利得gc0、計算機602からの相関c0、c1、c2、c3、c4およびc5、ならびに利得符号帳601からの量子化された適応符号帳の利得gpおよび補正係数γにより、誤差信号eiのエネルギEiを計算する。計算機603からの誤差信号のエネルギ604は、利得符号帳探索機構に戻される。再び、利得符号帳601のインデックスの全部または一部がこのように探索され、最低誤差エネルギ604を生じる利得符号帳601のインデックスが獲得インデックスとして選択され、復号器に送信される。
図6の利得量子化器600では、利得符号帳601は、サブフレームに応じて異なるものとすることができるサイズを有する。フレームの後方のサブフレームでは推定パラメータの数が増加することにより、固定符号帳の利得をよりよく推定することができる。したがって、より後方のサブフレームではより小さい数のビットを使用することができる。1つの実施形態では、4つの(4)のサブフレームが使用され、利得符号帳のビット数は、サブフレーム1、2、3、および4にそれぞれ対応して8、7、6、および6である。より低ビットレートの別の実施形態では、各サブフレームに6ビットが使用される。
復号器では、受信されたインデックスを使用して、量子化された適応符号帳の利得gpおよび利得符号帳からの補正係数γの値を検索する。固定符号帳の利得の推定は、前述の説明で述べたように、符号器と同じ方法で行われる。固定符号帳の利得の量子化された値は、式gc = gc0・γによって計算される。適応コードベクトルおよびイノベーションコードベクトルの両方が、ビットストリームから復号されて、適応励振信号の寄与分および固定励振信号の寄与分になり、これらにそれぞれの適応符号帳の利得および固定符号帳の利得を乗算する。両方の励振信号の寄与分がまとめて加算されて、全励振信号を形成する。合成信号は、CELPコーディングの技術で知られているようにLP合成フィルタを通して全励振信号をフィルタ処理することによって見出される。
信号の分類
図1の例示のパラメータtについては、フレームの分類を決定するために異なる方法を使用することができる。次の説明では、フレームが、無声フレーム、有声フレーム、汎用フレーム、または遷移フレームとして分類される非限定的な例をあげる。しかし、音声クラスの数は、この例で使用される数とは異なる可能性がある。例えば、分類は、1つの実施形態では単に有声か、無声かとすることができる。別の実施形態では、強度に有声および強度に無声など、より多くの分類を追加することができる。
信号の分類は、3つのステップで行うことができ、各ステップが特定の信号クラスを区別する。まず、信号動作検出器(SAD)が、アクティブ音声フレームと非アクティブ音声フレームとを区別する。非アクティブ音声フレームが検出される(背景雑音信号)場合、分類チェーンは終了し、フレームはコンフォートノイズ生成器(comfort noise generation、CNG)を用いて符号化される。アクティブ音声フレームが検出される場合、フレームは、第2の分類器に従って、無声フレームを区別する。分類器が、フレームを無声音声信号として分類する場合、分類チェーンは終了し、フレームは無声信号に最適化された符号化方法を使用して符号化される。その他の場合は、フレームは、「安定した有声(stable voiced)」分類モジュールを介して処理される。フレームが、安定した有声フレームとして分類される場合、フレームは安定した有声信号に最適化された符号化方法を使用して符号化される。その他の場合は、フレームは、有声の立ち上がり(voiced onset)または急速に発達する(evolving)有声信号のような非定常信号セグメントを含む可能性がある。こうしたフレームは一般的に、優れた主観的品質を維持するために、汎用符号器および高ビットレートを必要とする。開示する利得量子化技術は、安定した有声フレームおよび汎用フレームに対して開発され、最適化されてきた。しかし、この技術は、いかなる他の信号クラスにも容易に拡張することができる。
以下では、無声信号フレームおよび有声信号フレームの分類について説明する。
音信号の無声部分は、周期的成分がないことによって特徴付けられ、エネルギおよびスペクトルが急速に変化する不安定フレームと、こうした特徴が比較的安定して維持される安定フレームとにさらに分割することができる。無声フレームの分類は、次のパラメータを使用する:
・平均正規化相関として計算される、有声化尺度(voicing measure)
Figure 0006316398
・平均スペクトル傾斜尺度(average spectral tilt measure)
Figure 0006316398
・破裂音信号セグメントを効率的に検出するための低レベルにおける最大短時間エネルギ増加
Figure 0006316398
・フレーム安定性を評価するための最大短時間エネルギ変動(dE)
・その全内容を参照により本明細書に組み込んでいる[Jelinek, M., Vaillancourt, T.,Gibbs, J.,「G.718: A new embedded speech and audio coding standard with high resilience to error-prone transmission channels」,In IEEE Communications Magazine, vol. 47, pp. 117-123, October 2009]に記載されるように、無声信号から音楽を見分けるための音色安定性(tonal stability)
・極めて低エネルギの信号を検出するための相対フレームエネルギ(Erel)
有声化尺度
有声化尺度を測定するために使用する正規化相関を、開ループピッチ解析の一部として計算する。CELP符号化の技術では、開ループ探索モジュールは、通常、フレームあたり2つの推定を出力する。ここでは、開ループ探索モジュールはまた、正規化相関尺度(normalized correlation measures)を出力するためにも使用される。こうした正規化相関は、開ループピッチ遅延で重み付き信号および過去の重み付き信号について計算される。重み付き音声信号sw(n)は、聴覚重み付けフィルタを使用して計算される。例えば、広帯域信号に適した、分母(denominator)を固定した聴覚重み付けフィルタが使用される。聴覚重み付けフィルタの伝達関数の一例が、次の関係により求められる:
Figure 0006316398
ここで、A(z)は、レヴィンソンダービン(Levinson-Durbin)のアルゴリズムによって計算される線形予測(LP)フィルタの伝達関数であり、次の関係によって求められる。
Figure 0006316398
LP解析および開ループピッチ解析は、CELP符号化の技術ではよく知られており、したがって本説明ではさらに説明しない。
有声化尺度
Figure 0006316398
は、次の関係によって求められる平均正規化相関として定義される:
Figure 0006316398
ここで、Cnorm(d0)、Cnorm(d1)、およびCnorm(d2)はそれぞれ、現フレームの前半の正規化相関、現フレームの後半の正規化相関、および先読み(次のフレームの初め)の正規化相関である。相関への引数は、開ループピッチラグである。
スペクトル傾斜
スペクトル傾斜は、エネルギの周波数分布に関する情報を含む。スペクトル傾斜は、低周波数に集中しているエネルギと、高周波数に集中しているエネルギとの比として周波数領域で推定することができる。しかし、スペクトル傾斜はまた、信号の2つの第1の自己相関係数の比のような異なる方法で推定することもできる。
高周波数および低周波数のエネルギは、その全内容を、参照により本明細書に組み込む、[J. D. Johnston,「Transform Coding of Audio Signals Using Perceptual Noise Criteria」,IEEE Journal on Selected Areas in Communications,vol. 6,no. 2, pp. 314-323,February 1988]に記載されるように、知覚臨界帯域(perceptual critical band)に従って計算される。高周波数のエネルギは、次の関係を使用して、最後の2つの臨界帯域の平均エネルギとして計算される:
Figure 0006316398
ここでECB (i)はi番目の帯域の臨界帯域エネルギであり、bmaxは最終臨界帯域である。低周波数のエネルギは、次の関係を使用して、最初の10の臨界帯域の平均エネルギとして計算される:
Figure 0006316398
ここでbminは、第1の臨界帯域である。
中間臨界帯域は、低周波数に高エネルギが集中した(概して有声)フレームと、高周波数に高エネルギが集中した(概して無声)フレームとの間の区別を向上させる傾向にないため、計算から除外される。中間ではエネルギ含量は、さらに述べるクラスのいずれについても特徴的ではなく、決定の混乱を増大させる。
スペクトル傾斜は、
Figure 0006316398
によって求められ、
ここで、
Figure 0006316398
および
Figure 0006316398
は、それぞれ
Figure 0006316398
および
Figure 0006316398
と同じ方法で計算された最後の2つの臨界帯域および最初の10の臨界帯域の平均雑音エネルギである。推定雑音エネルギは、傾斜の計算結果に加えられて、背景雑音の存在を説明する。スペクトル傾斜の計算は、フレームあたり2回行われ、平均スペクトル傾斜が計算されて、その後、無声フレームの分類においてこれを使用する。すなわち
Figure 0006316398
ここで、eoldは、前フレームの後半のスペクトル傾斜である。
低レベルにおける最大短時間エネルギ増加
低レベルにおける最大短時間エネルギ増加dE0は、入力音信号s(n)で評価され、n=0が現フレームの第1のサンプルに対応する。信号エネルギは、サブフレームあたり2回評価される。例えばフレームあたり4つのサブフレームのシナリオを仮定すると、エネルギはフレームあたり8回計算される。全フレーム長が、例えば256サンプルである場合、これらの短いセグメントのそれぞれが32サンプルを有することができる。計算では、前フレームからの最後の32サンプル、および次フレームからの最初の32サンプルの短時間エネルギもまた、考慮に入れる。短時間エネルギは、次の関係を使用して計算される:
Figure 0006316398
ここで、j=-1およびj=8は、それぞれ前フレームの最後、および次フレームの最初に対応する。9個の短時間エネルギの別のセットは、次の関係を使用して、先の式において信号インデックスを16サンプルだけ移動させることによって計算される:
Figure 0006316398
十分に低い、すなわち条件
Figure 0006316398
を満たすエネルギについては、第1のセットのエネルギに対して次の比
Figure 0006316398
が計算され、同じ計算がj=0,..,7で
Figure 0006316398
に対して繰り返されて、2つのセットの比rat(1)およびrat(2)を取得する。これらの2つのセットの最大値のみが、以下によって探索され、
dE0 = max(rat(1),rat(2) )
これが、低レベルにおける最大短時間エネルギ増加である。
最大短時間エネルギ変動
このパラメータdEは、低レベル条件は適用されないという違いがあるが、低レベルにおける最大短時間エネルギ増加と同様である。したがって、パラメータは、次の4つの値の最大値として計算される:
Figure 0006316398
無声信号の分類
無声信号フレームの分類は、上述のパラメータ、すなわち有声化尺度
Figure 0006316398
、平均スペクトル傾斜
Figure 0006316398
、低レベルにおける最大短時間エネルギ増加dE0、および最大短時間エネルギ変動dEに基づく。アルゴリズムは、雑音エネルギ更新フェーズ中に計算される、音色安定性パラメータ、SADフラグ、および相対フレームエネルギによってさらに支援される。こうしたパラメータに関するさらなる詳細については、例えば、その全内容を参照により本明細書に組み込む、[Jelinek, M. et al.,「Advances in source-controlled variable bitrate wideband speech coding」,Special Workshop in MAUI (SWIM): Lectures by masters in speech processing,Maui,Hawaii,January 12-14, 2004]を参照されたい。
相対フレームエネルギは、以下によって求められる。
Figure 0006316398
ここで、Etは(dB中の)全フレームエネルギであり、
Figure 0006316398
は、
Figure 0006316398
によって各アクティブフレームの間に更新される長期平均フレームエネルギである。
広帯域信号の無声分類のルールを以下にまとめる。
Figure 0006316398
この条件の第1の行は、低エネルギの信号およびそのエネルギを高周波数に集中させている低相関を有する信号に関連している。第2の行は、有声オフセットを扱い、第3の行は、破裂音信号セグメントを扱い、第4の行は、有声の立ち上がりに関連している。最終行は、別の方法では無声として宣言される音楽信号を区別する。
組み合わせられた条件が満たされる場合、現フレームを無声と宣言することによって分類は終了する。
有声信号の分類
フレームが非アクティブフレームとして、または無声フレームとして分類されない場合、フレームは、安定した有声フレームであるかどうかをテストされる。決定ルールは、各サブフレーム(1/4サブサンプル分解能を有する)における正規化相関
Figure 0006316398
平均スペクトル傾斜
Figure 0006316398
およびすべてのサブフレーム(1/4サブサンプル分解能を有する)における開ループピッチ推定に基づく。
開ループピッチ推定手順は、3つの開ループピッチラグ、すなわち前半フレーム、後半フレーム、および先読み(次のフレームの前半フレーム)に対応するd0、d1、およびd2を計算する。4つのすべてのサブフレームにおける正確なピッチ情報を取得するために、1/4サンプル分解能の分数ピッチ高精度化(fractional pitch refinement)を計算する。この高精度化は、知覚的に重み付けされた入力信号swd(n)(例えば、上述の聴覚重み付けフィルタによってフィルタリングされた入力音信号s(n))で計算される。各サブフレームの初めで、1サンプルの分解能を有する短い相関解析(40サンプル)が、次の遅延、すなわち第1および第2のサブフレームにはd0、第3および第4のサブフレームにはd1を使用して区間(-7, +7)で行われる。次いで相関は、その最大値付近の分数位置dmax-3/4、dmax-1/2、dmax-1/4、dmax、dmax+1/4、dmax+1/2、dmax+3/4で補間される。最大相関を生じる値は、高精度化ピッチラグとして選択される。
4つのすべてのサブフレームの高精度化された開ループピッチラグをT(0)、T(1)、T(2)、およびT(3)として示し、これらの対応する正規化相関をC(0)、C(1)、C(2)、およびC(3)として示す。次に、有声信号の分類条件は、以下によって求められる。
Figure 0006316398
上記の有声信号の分類条件は、正規化相関はすべてのサブフレームで十分に高くなければならないこと、ピッチの推定はフレームにわたって発散してはならないこと、エネルギは低周波数に集中しなければならないことを示す。この条件が満たされる場合、現フレームを有声として宣言することによって、分類は終了する。そうでない場合、現フレームは汎用として宣言される。
本発明を、その非限定的な例示的実施形態を参照して上記の説明で述べたが、これらの実施形態は、本発明の趣旨および本質を逸脱することなく添付の特許請求の範囲の範囲内で自在に変更することができる。
500 利得量子化器
501 フィルタ処理済み適応励振信号
502 フィルタ処理済みイノベーションコードベクトル
503 利得符号帳
504 乗算器
505 固定寄与分の量子化された利得
507 励振信号の適応寄与分
508 乗算器
509 励振信号の固定寄与分
510 加算器
511 フィルタ処理済み全励振信号
512 減算器
513 計算機
515 誤差信号のエネルギ

Claims (31)

  1. 符号化された音信号の、サブフレームを含むフレームにおける励振信号の固定寄与分の利得を量子化するためのCELP符号器の中で実現される装置であって、
    前記フレームの分類を表すパラメータ用の入力と、
    前記フレームの分類を表すパラメータを供給される、前記フレームのサブフレームにおける励振信号の固定寄与分の利得の推定器と、
    推定利得を使用して、前記サブフレームにおける励振信号の固定寄与分の利得の予測量子化器とを備え、
    前記予測量子化器が、前記推定利得の補正係数を前記励振信号の固定寄与分の利得の量子化として決定し、前記補正係数を乗算した推定利得が、前記励振信号の固定寄与分の量子化された利得をもたらし、
    前記推定器が、前記フレームの第1のサブフレームについて、
    (a)前記フレームの分類を表すパラメータに応じて対数領域で前記励振信号の固定寄与分の利得の線形推定を行う計算機と、
    (b)前記計算機からの線形利得推定から対数領域の固定符号帳からのフィルタ処理済みイノベーションコードベクトルのエネルギを減算して、対数領域の利得を生成する減算器と、
    (c)前記減算器からの対数領域の利得を線形領域にして、推定利得を生成する変換器と、
    (d)前記推定利得に前記補正係数を乗算して、前記励振信号の固定寄与分の量子化された利得を生成する乗算器とを備える、
    装置。
  2. 前記推定器が、前記第1のサブフレームに続く前記フレームの各サブフレームについて、前記フレームの分類を表すパラメータ、ならびに前記フレームの少なくとも1つの前のサブフレームの励振信号の適応寄与分および固定寄与分の利得に対応して、前記励振信号の固定寄与分の利得を推定する、請求項1に記載の量子化装置。
  3. 前記推定器が、前記第1のサブフレームに続く各サブフレームについて、線形推定から対数領域の励振信号の固定寄与分の利得を推定する計算機と、対数領域の励振信号の固定寄与分の推定利得を線形領域に戻す変換を行って、前記推定利得を生成する変換器とを備える、請求項2に記載の量子化装置。
  4. 前記フレームの少なくとも1つの前のサブフレームの励振信号の適応寄与分および固定寄与分の利得が、量子化された利得であり、前記励振信号の適応寄与分の量子化された利得が、前記計算機に直接供給され、一方前記励振信号の固定寄与分の量子化された利得が、対数計算機を介して対数領域で前記計算機に供給される、請求項3に記載の量子化装置。
  5. 前記対数領域の励振信号の固定寄与分の利得を推定する計算機が、前記フレームの分類パラメータおよび少なくとも1つの前のサブフレームの励振信号の適応寄与分および固定寄与分の利得に関連して、大規模トレーニングデータベースを使用して決定される各サブフレームによって異なる推定係数を使用する、請求項4に記載の量子化装置。
  6. 前記励振信号の固定寄与分の利得の推定を行う計算機が、分類パラメータに関連して、大規模トレーニングデータベースを使用して決定される推定係数を使用する、請求項1に記載の量子化装置。
  7. 前記推定器が、前記励振信号の固定寄与分の利得を推定するために、前記フレームの各サブフレームによって異なる推定係数を使用する、請求項1に記載の量子化装置。
  8. 前記推定器が、前記励振信号の固定寄与分の利得の推定を前記フレームに限定して、フレーム消失に対する耐性を増大させる、請求項1に記載の量子化装置。
  9. 符号化された音信号のフレームにおける励振信号の適応寄与分および固定寄与分の利得を共同量子化するための装置であって、
    前記励振信号の適応寄与分の利得の量子化器と、
    請求項1から8のいずれか一項に定義する励振信号の固定寄与分の利得を量子化するための装置と
    を備える、装置。
  10. 符号化された音信号の、サブフレームを含むフレームにおける励振信号の固定寄与分の利得を量子化するためのCELP符号器の中で実現される方法であって、
    前記フレームの分類を表すパラメータを受信するステップと、
    前記フレームの分類を表すパラメータを使用して、前記フレームのサブフレームにおける励振信号の固定寄与分の利得を推定するステップと、
    推定利得を使用して、前記サブフレームにおける励振信号の固定寄与分の利得を予測量子化するステップとを含み、
    前記励振信号の固定寄与分の利得を予測量子化するステップが、前記推定利得の補正係数を、前記励振信号の固定寄与分の利得の量子化として決定し、前記補正係数を乗算した推定利得が、前記励振信号の固定寄与分の量子化された利得をもたらすステップを含み、
    前記励振信号の固定寄与分の利得を推定するステップが、前記フレームの第1のサブフレームについて、
    (a)前記フレームの分類を表すパラメータに応じて対数領域で前記励振信号の固定寄与分の利得の線形推定を計算するステップと、
    (b)線形利得推定から対数領域の固定符号帳からのフィルタ処理済みイノベーションコードベクトルのエネルギを減算して、対数領域の利得を生成するステップと、
    (c)前記減算からの対数領域の利得を線形領域に変換して、推定利得を生成するステップと、
    (d)前記推定利得に前記補正係数を乗算して、前記励振信号の固定寄与分の量子化された利得を生成するステップとを含む、
    方法。
  11. 前記励振信号の固定寄与分の利得を推定するステップが、前記第1のサブフレームに続く前記フレームの各サブフレームについて、前記フレームの分類を表すパラメータ、ならびに前記フレームの少なくとも1つの前のサブフレームの励振信号の適応寄与分および固定寄与分の利得に対応して、前記励振信号の前記固定寄与分の利得を推定する、請求項10に記載の量子化方法。
  12. 前記励振信号の固定寄与分の利得を推定するステップが、前記第1のサブフレームに続く各サブフレームについて、線形推定から対数領域の励振信号の固定寄与分の利得を推定するステップと、対数領域の励振信号の固定寄与分の推定利得を線形領域に戻す変換を行って、前記推定利得を生成するステップとを含む、請求項11に記載の量子化方法。
  13. 前記フレームの少なくとも1つの前のサブフレームの励振信号の適応寄与分の利得が、量子化された利得であり、前記フレームの少なくとも1つの前のサブフレームの励振信号の固定寄与分の利得が、対数領域の量子化された利得である、請求項12に記載の量子化方法。
  14. 前記励振信号の固定寄与分の利得の推定を計算するステップが、分類パラメータに関連して、大規模トレーニングデータベースを使用して決定される推定係数を使用するステップを含む、請求項10に記載の量子化方法。
  15. 前記励振信号の固定寄与分の利得を推定するステップが、前記励振信号の固定寄与分の利得を推定するために、前記フレームの各サブフレームによって異なる推定係数を使用するステップを含む、請求項10に記載の量子化方法。
  16. 前記励振信号の固定寄与分の利得の推定が前記フレームに限定され、フレーム消失に対する耐性を増大させる、請求項10に記載の量子化方法。
  17. 符号化された音信号のフレームにおける励振信号の適応寄与分および固定寄与分の利得を共同量子化するための方法であって、
    前記励振信号の適応寄与分の利得を量子化するステップと、
    請求項10から16のいずれか一項に定義する方法を使用して励振信号の固定寄与分の利得を量子化するステップと
    を含む方法。
  18. 符号化された音信号の、複数のサブフレームを含むフレームのサブフレームにおける励振信号の固定寄与分の量子化された利得を検索するための装置であって、
    利得符号帳のインデックスの受信機と、
    前記フレームの分類を表すパラメータを供給される、前記サブフレームにおける励振信号の固定寄与分の利得の推定器とを備え、
    前記推定器が、前記フレームの第1のサブフレームについて、
    (a)前記フレームの分類を表すパラメータに応じて対数領域で前記励振信号の固定寄与分の利得の線形推定を行う計算機と、
    (b)前記計算機からの線形利得推定から対数領域の固定符号帳からのフィルタ処理済みイノベーションコードベクトルのエネルギを減算して、対数領域の利得を生成する減算器と、
    (c)前記減算器からの対数領域の利得を線形領域にして、推定利得を生成する変換器とを備え、
    更に、前記利得符号帳のインデックスに応じて補正係数を供給するための利得符号帳と、
    前記推定利得に前記補正係数を乗算して、前記サブフレームにおける前記励振信号の固定寄与分の量子化された利得を提供する乗算器とを備える、
    装置。
  19. 前記推定器が、前記第1のサブフレームに続く前記フレームの各サブフレームについて、前記フレームの分類を表すパラメータ、ならびに前記フレームの少なくとも1つの前のサブフレームの励振信号の適応寄与分および固定寄与分の利得に対応して、前記励振信号の固定寄与分の利得を推定する、請求項18に記載の励振信号の固定寄与分の量子化された利得を検索するための装置。
  20. 前記推定器が、前記励振信号の固定寄与分の利得を推定するために、前記フレームの各サブフレームによって異なる推定係数を使用する、請求項18または19に記載の励振信号の固定寄与分の量子化された利得を検索するための装置。
  21. 前記推定器が、前記励振信号の固定寄与分の利得の推定を前記フレームに限定して、フレーム消失に対する耐性を増大させる、請求項18から20のいずれか一項に記載の励振信号の固定寄与分の量子化された利得を検索するための装置。
  22. 符号化された音信号の、複数のサブフレームを含むフレームのサブフレームにおける励振信号の適応寄与分および固定寄与分の量子化された利得を検索するための装置であって、
    利得符号帳のインデックスの受信機と、
    前記フレームの分類を表すパラメータを供給される、前記サブフレームにおける励振信号の固定寄与分の利得の推定器とを備え、
    前記推定器が、前記フレームの第1のサブフレームについて、
    (a)前記フレームの分類を表すパラメータに応じて対数領域で前記励振信号の固定寄与分の利得の線形推定を行う計算機と、
    (b)前記計算機からの線形利得推定から対数領域の固定符号帳からのフィルタ処理済みイノベーションコードベクトルのエネルギを減算して、対数領域の利得を生成する減算器と、
    (c)前記減算器からの対数領域の利得を線形領域にして、推定利得を生成する変換器とを備え、
    更に、前記利得符号帳のインデックスに応じて前記サブフレームに対して、前記励振信号の適応寄与分の量子化された利得、および補正係数を供給するための利得符号帳と、
    前記推定利得に前記補正係数を乗算して、前記サブフレームにおける前記励振信号の固定寄与分の量子化された利得を提供する乗算器とを備える、
    装置。
  23. 前記利得符号帳が、前記励振信号の適応寄与分の量子化された利得と、前記推定利得の補正係数とをそれぞれ含んだエントリを含む、請求項22に記載の励振信号の適応寄与分および固定寄与分の量子化された利得を検索するための装置。
  24. 前記利得符号帳が、前記フレームの異なるサブフレームで異なるサイズを有する、請求項22または23に記載の励振信号の適応寄与分および固定寄与分の量子化された利得を検索するための装置。
  25. 符号化された音信号の、複数のサブフレームを含むフレームのサブフレームにおける励振信号の固定寄与分の量子化された利得を検索するための方法であって、
    利得符号帳のインデックスを受信するステップと、
    前記フレームの分類を表すパラメータを使用して、前記サブフレームにおける励振信号の固定寄与分の利得を推定するステップとを含み、
    前記励振信号の固定寄与分の利得を推定するステップが、前記フレームの第1のサブフレームについて、
    (a)前記フレームの分類を表すパラメータに応じて対数領域で前記励振信号の固定寄与分の利得の線形推定を計算するステップと、
    (b)線形利得推定から対数領域の固定符号帳からのフィルタ処理済みイノベーションコードベクトルのエネルギを減算して、対数領域の利得を生成するステップと、
    (c)前記減算からの対数領域の利得を線形領域に変換して、推定利得を生成するステップとを含み、
    更に、利得符号帳から、前記サブフレームに対して、前記利得符号帳のインデックスに応じて補正係数を供給するステップと、
    前記推定利得に前記補正係数を乗算して、前記サブフレームにおける励振信号の固定寄与分の量子化された利得を提供するステップとを含む、
    方法。
  26. 前記励振信号の固定寄与分の利得を推定するステップが、前記第1のサブフレームに続く前記フレームの各サブフレームにおいて、前記フレームの分類を表すパラメータ、ならびに前記フレームの少なくとも1つの前のサブフレームの励振信号の適応寄与分および固定寄与分の利得を使用して、前記励振信号の固定寄与分の利得を推定するステップを含む、請求項25に記載の励振信号の固定寄与分の量子化された利得を検索するための方法。
  27. 前記励振信号の固定寄与分の利得を推定するステップが、前記フレームの各サブフレームによって異なる推定係数を使用するステップを含む、請求項25または26に記載の励振信号の固定寄与分の量子化された利得を検索するための方法。
  28. 前記励振信号の固定寄与分の利得の推定が前記フレームに限定され、フレーム消失に対する耐性を増大させる、請求項25から27のいずれか一項に記載の励振信号の固定寄与分の量子化された利得を検索するための方法。
  29. 符号化された音信号の、複数のサブフレームを含むフレームのサブフレームにおける励振信号の適応寄与分および固定寄与分の量子化された利得を検索するための方法であって、
    利得符号帳のインデックスを受信するステップと、
    前記フレームの分類を表すパラメータを使用して、前記サブフレームにおける励振信号の固定寄与分の利得を推定するステップとを含み、
    前記励振信号の固定寄与分の利得を推定するステップが、前記フレームの第1のサブフレームについて、
    (a)前記フレームの分類を表すパラメータに応じて対数領域で前記励振信号の固定寄与分の利得の線形推定を計算するステップと、
    (b)線形利得推定から対数領域の固定符号帳からのフィルタ処理済みイノベーションコードベクトルのエネルギを減算して、対数領域の利得を生成するステップと、
    (c)前記減算からの対数領域の利得を線形領域に変換して、推定利得を生成するステップとを含み、
    更に、利得符号帳から、前記サブフレームに対して、前記励振信号の適応寄与分の量子化された利得、および前記利得符号帳のインデックスに応じて補正係数を供給するステップと、
    前記推定利得に前記補正係数を乗算して、前記サブフレームにおける励振信号の固定寄与分の量子化された利得を提供するステップとを含む、
    方法。
  30. 前記利得符号帳が、前記励振信号の適応寄与分の量子化された利得と、前記推定利得の補正係数とをそれぞれ含んだエントリを含む、請求項29に記載の励振信号の適応寄与分および固定寄与分の量子化された利得を検索するための方法。
  31. 前記利得符号帳が、前記フレームの異なるサブフレームで異なるサイズを有する、請求項29または30に記載の励振信号の適応寄与分および固定寄与分の量子化された利得を検索するための方法。
JP2016252938A 2011-02-15 2016-12-27 Celpコーデックにおける励振信号の適応寄与分および固定寄与分の利得を量子化するための装置および方法 Active JP6316398B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161442960P 2011-02-15 2011-02-15
US61/442,960 2011-02-15

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013552805A Division JP6072700B2 (ja) 2011-02-15 2012-02-14 Celpコーデックにおける励振信号の適応寄与分および固定寄与分の利得を量子化するための装置および方法

Publications (2)

Publication Number Publication Date
JP2017097367A JP2017097367A (ja) 2017-06-01
JP6316398B2 true JP6316398B2 (ja) 2018-04-25

Family

ID=46637577

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013552805A Active JP6072700B2 (ja) 2011-02-15 2012-02-14 Celpコーデックにおける励振信号の適応寄与分および固定寄与分の利得を量子化するための装置および方法
JP2016252938A Active JP6316398B2 (ja) 2011-02-15 2016-12-27 Celpコーデックにおける励振信号の適応寄与分および固定寄与分の利得を量子化するための装置および方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013552805A Active JP6072700B2 (ja) 2011-02-15 2012-02-14 Celpコーデックにおける励振信号の適応寄与分および固定寄与分の利得を量子化するための装置および方法

Country Status (18)

Country Link
US (1) US9076443B2 (ja)
EP (2) EP2676271B1 (ja)
JP (2) JP6072700B2 (ja)
KR (1) KR101999563B1 (ja)
CN (2) CN103392203B (ja)
AU (1) AU2012218778B2 (ja)
CA (1) CA2821577C (ja)
DE (1) DE20163502T1 (ja)
DK (1) DK2676271T3 (ja)
ES (1) ES2812598T3 (ja)
HR (1) HRP20201271T1 (ja)
HU (1) HUE052882T2 (ja)
LT (1) LT2676271T (ja)
MX (1) MX2013009295A (ja)
RU (1) RU2591021C2 (ja)
SI (1) SI2676271T1 (ja)
WO (1) WO2012109734A1 (ja)
ZA (1) ZA201305431B (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9626982B2 (en) * 2011-02-15 2017-04-18 Voiceage Corporation Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec
US9111531B2 (en) 2012-01-13 2015-08-18 Qualcomm Incorporated Multiple coding mode signal classification
EP2927905B1 (en) 2012-09-11 2017-07-12 Telefonaktiebolaget LM Ericsson (publ) Generation of comfort noise
FR3007563A1 (fr) * 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
CN104299614B (zh) * 2013-07-16 2017-12-29 华为技术有限公司 解码方法和解码装置
EP3038104B1 (en) * 2013-08-22 2018-12-19 Panasonic Intellectual Property Corporation of America Speech coding device and method for same
MY180722A (en) 2013-10-18 2020-12-07 Fraunhofer Ges Forschung Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
MY187944A (en) 2013-10-18 2021-10-30 Fraunhofer Ges Forschung Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information
CN106683681B (zh) * 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
MX2020002972A (es) 2017-09-20 2020-07-22 Voiceage Corp Metodo y dispositivo para asignar un presupuesto de bits entre subtramas en un codec celp.
US11710492B2 (en) * 2019-10-02 2023-07-25 Qualcomm Incorporated Speech encoding using a pre-encoded database
CN117476022A (zh) * 2022-07-29 2024-01-30 荣耀终端有限公司 声音编解码方法以及相关装置、系统

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5681862A (en) * 1993-03-05 1997-10-28 Buckman Laboratories International, Inc. Ionene polymers as microbicides
US5450449A (en) * 1994-03-14 1995-09-12 At&T Ipm Corp. Linear prediction coefficient generation during frame erasure or packet loss
SE504397C2 (sv) * 1995-05-03 1997-01-27 Ericsson Telefon Ab L M Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering
EP0764939B1 (en) * 1995-09-19 2002-05-02 AT&T Corp. Synthesis of speech signals in the absence of coded parameters
JP3230966B2 (ja) * 1995-10-09 2001-11-19 日本ガスケット株式会社 金属製ガスケット
TW326070B (en) * 1996-12-19 1998-02-01 Holtek Microelectronics Inc The estimation method of the impulse gain for coding vocoder
US5953679A (en) * 1997-04-16 1999-09-14 The United States Of America As Represented By The Secretary Of Army Method for recovery and separation of trinitrotoluene by supercritical fluid extraction
FI113571B (fi) * 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
US6141638A (en) * 1998-05-28 2000-10-31 Motorola, Inc. Method and apparatus for coding an information signal
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6314393B1 (en) * 1999-03-16 2001-11-06 Hughes Electronics Corporation Parallel/pipeline VLSI architecture for a low-delay CELP coder/decoder
CN1075733C (zh) * 1999-07-30 2001-12-05 赵国林 一种养颜口服液及其制作方法
CN1242379C (zh) * 1999-08-23 2006-02-15 松下电器产业株式会社 音频编码装置
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
AU7486200A (en) * 1999-09-22 2001-04-24 Conexant Systems, Inc. Multimode speech encoder
US6574593B1 (en) * 1999-09-22 2003-06-03 Conexant Systems, Inc. Codebook tables for encoding and decoding
ATE439666T1 (de) * 2001-02-27 2009-08-15 Texas Instruments Inc Verschleierungsverfahren bei verlust von sprachrahmen und dekoder dafer
CN1820306B (zh) * 2003-05-01 2010-05-05 诺基亚有限公司 可变比特率宽带语音编码中增益量化的方法和装置
US20070282601A1 (en) * 2006-06-02 2007-12-06 Texas Instruments Inc. Packet loss concealment for a conjugate structure algebraic code excited linear prediction decoder
US8010351B2 (en) * 2006-12-26 2011-08-30 Yang Gao Speech coding system to improve packet loss concealment
US8655650B2 (en) * 2007-03-28 2014-02-18 Harris Corporation Multiple stream decoder

Also Published As

Publication number Publication date
EP2676271A4 (en) 2016-01-20
DE20163502T1 (de) 2020-12-10
AU2012218778A1 (en) 2013-07-18
NZ611801A (en) 2015-06-26
EP2676271B1 (en) 2020-07-29
AU2012218778B2 (en) 2016-10-20
MX2013009295A (es) 2013-10-08
EP2676271A1 (en) 2013-12-25
ZA201305431B (en) 2016-07-27
EP3686888A1 (en) 2020-07-29
CN103392203A (zh) 2013-11-13
SI2676271T1 (sl) 2020-11-30
LT2676271T (lt) 2020-12-10
HRP20201271T1 (hr) 2020-11-13
RU2591021C2 (ru) 2016-07-10
CA2821577C (en) 2020-03-24
CN104505097A (zh) 2015-04-08
CN103392203B (zh) 2017-04-12
JP2017097367A (ja) 2017-06-01
CA2821577A1 (en) 2012-08-23
JP6072700B2 (ja) 2017-02-01
WO2012109734A8 (en) 2012-09-27
WO2012109734A1 (en) 2012-08-23
KR101999563B1 (ko) 2019-07-15
US9076443B2 (en) 2015-07-07
RU2013142151A (ru) 2015-03-27
KR20140023278A (ko) 2014-02-26
ES2812598T3 (es) 2021-03-17
JP2014509407A (ja) 2014-04-17
HUE052882T2 (hu) 2021-06-28
US20120209599A1 (en) 2012-08-16
CN104505097B (zh) 2018-08-17
DK2676271T3 (da) 2020-08-24

Similar Documents

Publication Publication Date Title
JP6316398B2 (ja) Celpコーデックにおける励振信号の適応寄与分および固定寄与分の利得を量子化するための装置および方法
US8392178B2 (en) Pitch lag vectors for speech encoding
RU2441286C2 (ru) Способ и устройство для обнаружения звуковой активности и классификации звуковых сигналов
WO2008049221A1 (en) Method and device for coding transition frames in speech signals
KR101698905B1 (ko) 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법
JPH04270398A (ja) 音声符号化方式
WO2024021747A1 (zh) 声音编解码方法以及相关装置、系统
KR102099293B1 (ko) 오디오 인코더 및 오디오 신호를 인코딩하는 방법
US10115408B2 (en) Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec
Oh et al. Output Recursively Adaptive (ORA) Tree Coding of Speech with VAD/CNG
NZ611801B2 (en) Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a celp codec
Chui et al. A hybrid input/output spectrum adaptation scheme for LD-CELP coding of speech
Han et al. On A Reduction of Pitch Searching Time by Preprocessing in the CELP Vocoder

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180327

R150 Certificate of patent or registration of utility model

Ref document number: 6316398

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250