JP2017509926A - 線形予測係数量子化方法及びその装置、並びに線形予測係数逆量子化方法及びその装置 - Google Patents

線形予測係数量子化方法及びその装置、並びに線形予測係数逆量子化方法及びその装置 Download PDF

Info

Publication number
JP2017509926A
JP2017509926A JP2016559611A JP2016559611A JP2017509926A JP 2017509926 A JP2017509926 A JP 2017509926A JP 2016559611 A JP2016559611 A JP 2016559611A JP 2016559611 A JP2016559611 A JP 2016559611A JP 2017509926 A JP2017509926 A JP 2017509926A
Authority
JP
Japan
Prior art keywords
quantization
unit
module
prediction
inverse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016559611A
Other languages
English (en)
Other versions
JP6542796B2 (ja
Inventor
ソン,ホ−サン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2017509926A publication Critical patent/JP2017509926A/ja
Application granted granted Critical
Publication of JP6542796B2 publication Critical patent/JP6542796B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

フレーム間予測なしに量子化を行う第1量子化モジュール、及びフレーム間予測と共に量子化を行う第2量子化モジュールを含み、第1量子化モジュールは、入力信号を量子化する第1量子化部と、第1量子化エラー信号を量子化する第3量子化部と、を含み、第2量子化モジュールは、予測エラーを量子化する第2量子化部と、第2量子化エラー信号を量子化する第4量子化部と、を含み、第1量子化部と第2量子化部は、トレリス構造のベクトル量子化器を含む量子化装置である。

Description

本発明は、線形予測係数の量子化及び逆量子化に係り、さらに具体的には、低い複雑度で、線形予測係数を効率的に量子化する方法及びその装置、並びにそれを逆量子化する方法及びその装置に関する。
音声あるいはオーディオのようなサウンド符号化システムにおいては、サウンドの短区間周波数特性を表現するために、線形予測符号化(LPC:linear predictive coding)係数が使用される。LPC係数は、入力サウンドをフレーム単位に分け、各フレーム別に、予測誤差のエネルギーを最小化させる形態で求められる。ところで、LPC係数は、ダイナミックレンジが大きく、使用されるLPCフィルタの特性が、LPC係数の量子化エラーに非常に敏感であり、フィルタの安定性が保証されない。
そのために、LPC係数を、フィルタの安定性確認が容易であり、補間に有利であり、量子化特性にすぐれる他の係数に変換して量子化を行うが、主に、線スペクトル周波数(LSF:line spectral frequency)あるいはイミタンススペクトル周波数(ISF:immittance spectral frequency)に変換して量子化することが好まれている。特に、LSF係数の量子化技法は、周波数領域及び時間領域で有するLSF係数のフレーム間の高い相関度を利用することにより、量子化利得を高めることができる。
LSF係数は、短区間サウンドの周波数特性を示し、入力サウンドの周波数特性が急激に変わるフレームの場合、当該フレームのLSF係数も急激に変化する。ところで、LSF係数のフレーム間高相関度を利用するフレーム間予測器を含む量子化器の場合、急激に変化するフレームに対しては、適切な予測が不可能であり、量子化性能が落ちる。従って、入力サウンドの各フレーム別信号特性に対応して最適化された量子化器を選択する必要がある。
本発明が解決しようとする技術的課題は、低い複雑度でLPC係数を効率的に量子化する方法及びその装置、並びにそれを逆量子化する方法及びその装置を提供するところにある。
一側面による量子化装置は、フレーム間予測なしに量子化を行う第1量子化モジュール;及びフレーム間予測と共に量子化を行う第2量子化モジュールを含み、前記第1量子化モジュールは、入力信号を量子化する第1量子化部と、第1量子化エラー信号を量子化する第3量子化部とを含み、前記第2量子化モジュールは、予測エラーを量子化する第2量子化部と、第2量子化エラー信号を量子化する第4量子化部とを含み、前記第1量子化部と前記第2量子化部は、トレリス構造のベクトル量子化器を含んでもよい。
一側面による量子化方法は、フレーム間予測なしに量子化を行う第1量子化モジュールと、フレーム間予測と共に量子化を行う第2量子化モジュールとのうち一つをオープンループ方式で選択する段階と、前記選択された量子化モジュールを使用して入力信号を量子化する段階と、を含み、前記第1量子化モジュールは、入力信号を量子化する第1量子化部と、第1量子化エラー信号を量子化する第3量子化部とを含み、前記第2量子化モジュールは、予測エラーを量子化する第2量子化部と、第2量子化エラー信号を量子化する第4量子化部とを含み、前記第3量子化部と前記第4量子化部は、コードブックを共有することができる。
一側面による逆量子化装置は、フレーム間予測なしに逆量子化を行う第1逆量子化モジュール;及びフレーム間予測と共に逆量子化を行う第2逆量子化モジュールを含み、前記第1逆量子化モジュールは、入力信号を逆量子化する第1逆量子化部と、前記第1逆量子化部と並列に配置される第3逆量子化部とを含み、前記第2逆量子化モジュールは、入力信号を逆量子化する第2逆量子化部と、前記第2逆量子化部と並列に配置される第4逆量子化部とを含み、前記第1逆量子化部と前記第2逆量子化部は、トレリス構造のベクトル逆量子化器を含んでもよい。
一側面による逆量子化方法は、フレーム間予測なしに逆量子化を行う第1逆量子化モジュールと、フレーム間予測と共に逆量子化を行う第2逆量子化モジュールとのうち一つを選択する段階と、前記選択された逆量子化モジュールを使用して入力信号を逆量子化する段階と、を含み、前記第1逆量子化モジュールは、入力信号を逆量子化する第1逆量子化部と、前記第1逆量子化部と並列に配置される第3逆量子化部とを含み、前記第2逆量子化モジュールは、入力信号を逆量子化する第2逆量子化部と、前記第2逆量子化部と並列に配置される第4逆量子化部とを含み、前記第3逆量子化部と前記第4逆量子化部は、コードブックを共有することができる。
音声信号あるいはオーディオ信号の特性により、複数の符号化モードに分け、各符号化モードに適用される圧縮率によって、多様なビット数を割り当てて量子化するにおいて、低ビット率で優秀な性能を有する量子化器を設計することにより、音声信号あるいはオーディオ信号をさらに効率的に量子化することができる。
また、多様なビットレートを提供する量子化装置を設計するとき、一部量子化器のコードブックを共有することにより、メモリ使用量を最小化することができる。
一実施形態によるサウンド符号化装置の構成を示したブロック図である。 他の実施形態によるサウンド符号化装置の構成を示したブロック図である。 一実施形態によるLPC量子化部の構成を示したブロック図である。 一実施形態による、図3の加重関数決定部の細部構成を示したブロック図である。 一実施形態による、図4の第1加重関数生成部の細部構成を示したブロック図である。 一実施形態によるLPC係数量子化部の構成を示したブロック図である。 一実施形態による、図6の選択部の構成を示したブロック図である。 一実施形態による、図6の選択部の動作について説明するフローチャートである。 図6に図示された第1量子化モジュールの多様な具現例を示したブロック図である。 図6に図示された第1量子化モジュールの多様な具現例を示したブロック図である。 図6に図示された第1量子化モジュールの多様な具現例を示したブロック図である。 図6に図示された第1量子化モジュールの多様な具現例を示したブロック図である。 図6に図示された第2量子化モジュールの多様な具現例を示したブロック図である。 図6に図示された第2量子化モジュールの多様な具現例を示したブロック図である。 図6に図示された第2量子化モジュールの多様な具現例を示したブロック図である。 図6に図示された第2量子化モジュールの多様な具現例を示したブロック図である。 BC−TCVQに加重値を適用する量子化器の多様な具現例を示したブロック図である。 BC−TCVQに加重値を適用する量子化器の多様な具現例を示したブロック図である。 BC−TCVQに加重値を適用する量子化器の多様な具現例を示したブロック図である。 BC−TCVQに加重値を適用する量子化器の多様な具現例を示したブロック図である。 BC−TCVQに加重値を適用する量子化器の多様な具現例を示したブロック図である。 BC−TCVQに加重値を適用する量子化器の多様な具現例を示したブロック図である。 一実施形態による、ローレートでオープンループ方式のスイッチング構造を有する量子化装置の構成を示すブロック図である。 一実施形態による、ハイレートでオープンループ方式のスイッチング構造を有する量子化装置の構成を示すブロック図である。 他の実施形態による、ローレートでオープンループ方式のスイッチング構造を有する量子化装置の構成を示すブロック図である。 他の実施形態による、ハイレートでオープンループ方式のスイッチング構造を有する量子化装置の構成を示すブロック図である。 一実施形態によるLPC係数量子化部の構成を示したブロック図である。 一実施形態による、閉ループ方式のスイッチング構造を有する量子化装置の構成を示すブロック図である。 他の実施形態による、閉ループ方式のスイッチング構造を有する量子化装置の構成を示すブロック図である。 一実施形態による逆量子化装置の構成を示したブロック図である。 一実施形態による逆量子化装置の細部的な構成を示したブロック図である。 他の実施形態による逆量子化装置の細部的な構成を示したブロック図である。
本発明は、多様な変換を加えることができ、さまざまな実施形態を有することができるが、特定実施形態を図面に例示し、詳細な説明によって具体的に説明する。しかし、それらは、本発明を特定の実施形態について限定するものではなく、本発明の技術的思想及び技術範囲に含まれる全ての変換、均等物ないし代替物を含むものであると理解される。本発明についての説明において、関連公知技術についての具体的な説明が、本発明の要旨を不明確にすると判断される場合、その詳細な説明を省略する。
第1、第2のような用語は、多様な構成要素についての説明に使用されるが、構成要素は、用語によって限定されるものではない。該用語は、1つの構成要素を他の構成要素から区別する目的のみに使用される。
本発明で使用される用語は、ただ特定の実施形態についての説明に使用されたものであり、本発明を限定する意図ではない。本発明で使用した用語は、本発明での機能を考慮しながら、可能な限り、現在広く使用される一般的な用語を選択したが、それは、当該分野の当業者の意図、判例、または新技術の出現などによっても異なる。また、特定の場合は、出願人が任意に選定した用語もあり、その場合、当該発明の説明部分で詳細にその意味を記載する。従って、本発明で使用される用語は、単純な用語の名称ではない、その用語が有する意味と、本発明の全般にわたった内容とを基に定義されなければならない。
単数の表現は、文脈上明白に異なって意味しない限り、複数の表現を含む。本発明において、「含む」または「有する」というような用語は、明細書上に記載された特徴、数字、段階、動作、構成要素、部品、またはそれらの組み合わせが存在するということを指定するものであり、1またはそれ以上の他の特徴や数字、段階、動作、構成要素、部品、またはそれらの組み合わせの存在または付加の可能性をあらかじめ排除するものではないと理解されなければならない。
以下、本発明の実施形態について、添付図面を参照して詳細に説明するが、添付図面を参照しての説明において、同一であるか、あるいは対応する構成要素は、同一図面番号を付し、それに係わる重複説明は省略する。
一般的に、TCQ(trellis coded quantization)は、入力ベクトルを各TCQステージに1つのエレメントを割り当てて量子化を行うのに比べ、TCVQ(trellis coded vector quantization)は、全体入力ベクトルを分割してサブベクトルを作った後、各サブベクトルをTCQステージに割り当てる構造を使用する。1つのエレメントを使用して量子化器を構成すれば、TCQになり、複数個のエレメントを組み合わせてサブベクトルを作って量子化器を構成すれば、TCVQになる。従って、二次元のサブベクトルを使用すれば、全体TCQステージの個数は、入力ベクトルサイズを2で割ったところと同一サイズになる。一般的に、音声/オーディオコーデックでは、入力信号をフレーム単位で符号化を行い、毎フレームごとに、LSF(line spectral frequency)係数を抽出する。LSF係数は、ベクトル形態であり、一般的に10または16次数を使用し、その場合、二次元のTCVQを考慮すれば、サブベクトルの個数は、5または8になる。
図1は、一実施形態によるサウンド符号化装置の構成を示したブロック図である。図1に図示されたサウンド符号化装置100は、符号化モード選択部110、LPC(linear predictive coding)係数量子化部130、励起信号符号化部150を含んでもよい。各構成要素は、少なくとも1以上のモジュールに一体化され、少なくとも1以上のプロセッサ(図示せず)によっても具現される。ここで、サウンドは、オーディオまたは音声、あるいはオーディオと音声との混合信号を意味するので、以下では、説明の便宜のために、サウンドを音声とする。
図1を参照すれば、符号化モード選択部110は、マルチレート(multi-rate)で対応し、複数個の符号化モードのうち一つを選択することができる。符号化モード選択部110は、信号特性、VAD(voice activity detection)情報、または以前フレームの符号化モードを利用して、現在フレームの符号化モードを決定することができる。
LPC係数量子化部130は、LPC係数を、選択された符号化モードに該当する量子化器を利用して量子化し、量子化されたLPC係数を表現する量子化インデックスを決定することができる。LPC係数量子化部130は、LPC係数を量子化に適する他の係数に変換して量子化を行うことができる。
励起信号符号化部150は、選択された符号化モードにより、励起信号符号化を行うことができる。励起信号符号化のために、CELP(code-excited linear prediction)アルゴリズムあるいはACELP(algebraic CELP)アルゴリズムを使用することができる。CELP技法によってLPC係数を符号化するための代表的なパラメータは、適応コードブックインデックス、適応コードブック利得、固定コードブックインデックス、固定コードブック利得などがある。励起信号符号化は、入力信号の特性に対応する符号化モードに基づいて行われる。一例を挙げれば、4個の符号化モード、UC(unvoiced coding)モード、VC(voiced coding)モード、GC(generic coding)モード、TC(transition coding)モードが使用される。UCモードは、音声信号が無声音や、無声音と類似した特性を有するノイズである場合、選択される。VCモードは、音声信号が有声音であるときに選択される。TCモードは、音声信号の特性が急変するトランジション区間の信号を符号化するときに使用される。GCモードは、それ以外の信号に対して符号化される。UCモード、VCモード、TCモード及びGCモードは、ITU−TG.718に記載された定義及び分類基準によるものであるが、それに限定されるものではない。励起信号符号化部150は、オープンループピッチ探索部(図示せず)、固定コードブック探索部(図示せず)または利得量子化部(図示せず)を含んでもよいが、符号化モードにより、励起信号符号化部150に、該構成要素が追加されても除去されてもよい。例えば、VCモードの場合、言及された構成要素がいずれも含まれ、UCモードの場合、オープンループピッチ探索部を使用しない。励起信号符号化部150は、量子化に割り当てられるビット数が多い場合、すなわち、高ビット率である場合、GCモードとVCモードとに単純化させることができる。すなわち、GCモードに、UCモードとTCモードとを含めることにより、GCモードを、UCモード及びTCモードまで使用することができる。一方、高ビット率である場合、IC(inactive coding)モード及びAC(audio coding)モードをさらに含んでもよい。励起信号符号化部150は、量子化に割り当てられるビット数が少ない場合、すなわち、低ビット率である場合、GCモード、UCモード、VCモード及びTCモードに分類することができる。一方、低ビット率である場合、ICモードとACモードとをさらに含んでもよい。ICモードは、黙音である場合に選択され、ACモードである場合、音声信号の特性がオーディオに近い場合に選択される。
一方、符号化モードは、音声信号の帯域によって、さらに細分化される。音声信号の帯域は、例えば、狭帯域(以下、NBとする)、広帯域(以下、WBとする)、超広帯域(以下、SWBとする)、全帯域(以下、FBとする)に分類することができる。NBは、300〜3,400Hzまたは50〜4,000Hzの帯域幅を有し、WBは、50〜7,000Hzまたは50〜8,000Hzの帯域幅を有し、SWBは、50〜14,000Hzまたは50〜16,000Hzの帯域幅を有し、FBは、20,000Hzまでの帯域幅を有することができる。ここで、帯域幅に係わる数値は、便宜上設定されたものであり、それらに限定されるものではない。また、帯域の区分も、さらに簡単にも複雑にも設定される。
一方、符号化モードの種類及び個数が決定されれば、決定された符号化モードに該当する音声信号を利用して、コードブックをさらに訓練させる必要がある。
励起信号符号化部150は、符号化モードにより、変換符号化アルゴリズムが追加して使用される。励起信号は、フレームあるいはサブフレームの単位で符号化される。
図2は、他の実施形態によるサウンド符号化装置の構成を示したブロック図である。図2に図示されたサウンド符号化装置200は、前処理部210、LP分析部220、加重信号算出部230、オープンループピッチ探索部240、信号分析及びVAD部250、符号化部260、メモリ更新部270及びパラメータ符号化部280を含んでもよい。各構成要素は、少なくとも1以上のモジュールに一体化され、少なくとも1以上のプロセッサ(図示せず)によっても具現される。ここで、サウンドは、オーディオまたは音声、あるいはオーディオと音声との混合信号を意味するので、以下では、説明の便宜のためにサウンドを音声とする。
図2を参照すれば、前処理部210は、入力される音声信号を前処理することができる。前処理過程を介して、音声信号から、所望しない周波数成分が除去されるか、あるいは符号化に有利になるように、音声信号の周波数特性が調整される。具体的には、前処理部210は、ハイパスフィルタリング(high pass filtering)、プリエンファシス(pre-emphasis)またはサンプリング(sampling)変換などを行うことができる。
LP分析部220は、前処理された音声信号に対して、LP分析を行い、LPC係数を抽出することができる。一般的に、フレーム当たり1回のLP分析が行われるが、さらなる音質向上のために、フレーム当たり2回以上のLP分析が行われてもよい。その場合、一度は、既存のLP分析であるフレームエンド(frame-end)のためのLPであり、残りは、音質向上のための中間サブフレーム(mid-subframe)のためのLPでもある。このとき、現在フレームのフレームエンドは、現在フレームを構成するサブフレームのうち最後のサブフレームを意味し、以前フレームのフレームエンドは、以前フレームを構成するサブフレームのうち最後のサブフレームを意味する。中間サブフレームは、以前フレームのフレームエンドである最後のサブフレームと、現在フレームのフレームエンドである最後のサブフレームとの間に存在するサブフレームのうち1以上のサブフレームを意味する。一例として、1つのフレームは、4個のサブフレームからも構成される。LPC係数は、入力信号が狭帯域(narrowband)である場合、次数10を使用し、広帯域(wideband)である場合、次数16〜20を使用するが、それらに限定されるものではない。
加重信号計算部230は、前処理された音声信号と、抽出されたLPC係数とを入力にし、認知加重フィルタに基づいて、認知加重フィルタリングされた信号を計算することができる。該認知加重フィルタは、人体聴覚構造のマスキング効果を利用するために、前処理した音声信号の量子化ノイズをマスキング範囲内に減らすことができる。
オープンループピッチ探索部240は、認知加重フィルタリングされた信号を利用して、オープンループピッチを探索することができる。
信号分析及びVAD部250は、入力信号の周波数特性を含む多様な特性を分析し、入力信号がアクティブ音声信号であるか否かということを決定することができる。
符号化部260は、信号特性、VAD情報、または以前フレームの符号化モードを利用して、現在フレームの符号化モードを決定し、選択された符号化モードに該当する量子化器を利用して、LPC係数を量子化し、選択された符号化モードにより、励起信号を符号化することができる。符号化部260は、図1に図示された構成要素を含んでもよい。
メモリ更新部270は、符号化された現在フレーム、及び符号化に使用されたパラメータを、次のフレームの符号化のために保存することができる。
パラメータ符号化部280は、復号端で復号に使用されるパラメータを符号化し、ビットストリームに含めることができる。望ましくは、符号化モードに対応するパラメータを符号化することができる。パラメータ符号化部280で生成されたビットストリームは、保存や伝送の目的に使用される。
下記表1は、4種符号化モードである場合、量子化スキーム(quantization scheme)と構造(structure)との一例を示したものである。ここで、フレーム間予測(inter-frame prediction)を使用せずに量子化する方式をセーフティネット(safety-net)スキームと命名し、フレーム間予測を使用して量子化する方式を予測(predictive)スキームと命名する。そして、VQは、ベクトル量子化器、BC−TCQは、ブロック制限されたトレリス符号化量子化器を示したものである。
一方、BC−TCVQは、ブロック制限されたトレリス符号化ベクトル量子化器を示したものである。TCVQは、TCQを一般化し、ベクトルコードブックとブランチラベルとを可能にしたものである。TCVQの主要特徴は、拡張されたセットのVQシンボルをサブセットにパーティショニングし、トレリスブランチを、それらサブセットにラベリングする点である。TCVQは、レート1/2コンボルーションコードに基づき、N=2νのトレリスステートを有し、各トレリスステートに出入りする2つのブランチを有する。M個のソースベクトルが与えられた場合、ビタビアルゴリズムを使用して、最小歪曲経路を探索する。その結果、最適のトレリス経路が、任意のN個の初期ステートから始まり、任意N個の最後のステートで終了する。TCVQにおいてコードブックは、2(R+R’)Lベクトルコードワードを有する。ここで、該コードブックは、ノミナルレートRVQの2R’L倍ほど多いコードワードを有するために、R’は、コードブック拡張要素(codebook expansion factor)であるといえる。エンコーディング過程について簡単に述べれば、次の通りである。まず、各入力ベクトルについて、各サブセットにおいて、最も近接したコードワードと対応する歪曲を探索し、サブセットSとラベルされたブランチに係わるブランチメトリックを、探索された歪曲としておき、ビタビアルゴリズムを使用して、トレリスを介した最小歪曲経路を探索する。BC−TCVQは、トレリス経路を指定するために、ソースサンプル当たり1ビットを必要とするので、低い複雑度を有する。BC−TCVQ構造は、0≦k≦νである場合、2個の初期トレリスステートと、それぞれ許容された初期トレリスステートとについて、2ν−k個の最後のステートを有することができる。シングルビタビエンコーディングは、許容された初期トレリスステートから始まり、ベクトルステージ(m−k)まで進む。初期ステートを指定するのにkビット必要となり、ベクトルステージ(m−k)まで経路を指定する(m−k)ビットが必要となる。初期トレリスステートに従属的な唯一の終了経路(terminating path)は、ベクトルステージmを介して、ベクトルステージ(m−k)において、各トレリスステートについてあらかじめ指定される。k値とは係わりなく、初期トレリスステートと、トレリスを介した経路とを指定するために、mビットを必要とする。
16kHz内部サンプリング周波数において、VCモードのためのBC−TCVQは、二次元ベクトルを有する16ステート8ステージTCVQを使用することができる。2つのエレメントを有するLSFサブベクトルは、各ステージに割り当てられる。下記表2は、16ステートBC−TCVQのための初期ステート、及び最後のステートを示す。ここで、kとνは、それぞれ2及び4であり、初期ステート及び最後のステートのための4ビットが使用される。
一方、符号化モードは、適用されるビット率によって変わる。前述のように、2つのモードを使用する高いビット率において、LPC係数を量子化するためにGCモードにおいて、フレーム当たり40あるいは41ビットを使用し、TCモードにおいて、フレーム当たり46ビットを使用することができる。
図3は、一実施形態によるLPC係数量子化部の構成を示したブロック図である。図3に図示されたLPC係数量子化部300は、第1係数変換部310、加重関数決定部330、ISF/LSF量子化部350及び第2係数変換部370を含んでもよい。各構成要素は、少なくとも1以上のモジュールに一体化され、少なくとも1以上のプロセッサ(図示せず)によっても具現される。LPC係数量子化部300には、量子化されていないLPC係数と、符号化モード情報とが入力として提供される。
図3を参照すれば、第1係数変換部310は、音声信号の現在フレームまたは以前フレームのフレームエンドをLP分析して抽出されたLPC係数を、他の形態の係数に変換することができる。一例として、第1係数変換部310は、現在フレームまたは以前フレームのフレームエンドに係わるLPC係数を、線スペクトル周波数(LSF)係数と、イミタンススペクトル周波数(ISF)係数とのうちいずれか1つの形態に変換することができる。そのとき、ISF係数やLSF係数は、LPC係数をさらに容易に量子化することができる形態の例を示す。
加重関数決定部330は、LPC係数から変換されたISF係数あるいはLSF係数を利用して、ISF/LSF量子化部350のための加重関数を決定することができる。決定された加重関数は、量子化経路あるいは量子化スキームを選択するか、あるいは量子化時、加重エラーを最小化するコードブックインデックスを探索する過程で使用される。一例として、加重関数決定部330は、大きさ加重関数、周波数加重関数、ISF/LSF係数の位置に基づいた加重関数を組み合わせ、最終加重関数を決定することができる。
そして、加重関数決定部330は、周波数帯域、符号化モード及びスペクトル分析情報のうち少なくとも一つを考慮し、加重関数を決定することができる。一例として、加重関数決定部330は、符号化モード別に最適の加重関数を導き出すことができる。そして、加重関数決定部330は、音声信号の周波数帯域によって、最適の加重関数を導き出すことができる。また、加重関数決定部330は、音声信号の周波数分析情報によって、最適の加重関数を導き出すことができる。そのとき、周波数分析情報は、スペクトルチルト情報を含んでもよい。加重関数決定部330は、追って具体的に説明する。
ISF/LSF量子化部350は、入力された符号化モードにより、最適量子化インデックスを求めることができる。具体的には、ISF/LSF量子化部350は、現在フレームのフレームエンドのLPC係数が変換されたISF係数あるいはLSF係数を量子化することができる。ISF/LSF量子化部350は、入力信号が非静的(non-stationary)である信号である場合、当該UCモードあるいは当該TCモードである場合には、フレーム間予測を使用せずに、セーフティネットスキームのみを利用して量子化を行い、静的(stationary)である信号に該当するVCモードあるいはGCモードである場合には、予測スキームとセーフティネットスキームとをスイッチングし、フレームエラーを考慮し、最適量子化スキームを決定することができる。
ISF/LSF量子化部350は、加重関数決定部330で決定された加重関数を利用して、ISF係数あるいはLSF係数を量子化することができる。ISF/LSF量子化部350は、加重関数決定部330で決定された加重関数を利用して、複数の量子化経路のうち一つを選択し、ISF係数あるいはLSF係数を量子化することができる。量子化の結果として得られたインデックスは、逆量子化過程を介して量子化されたISF係数(QISF)、あるいは量子化されたLSF係数(QLSF)が求められる。
第2係数変換部370は、量子化されたISF係数(QISF)、あるいは量子化されたLSF係数(QLSF)を、量子化されたLPC係数(QLPC)に変換することができる。
以下、LPC係数のベクトル量子化と加重関数との関係について説明する。
ベクトル量子化は、ベクトル内のエントリー(entry)をいずれも同一重要度と見なし、二乗誤差距離尺度(squared error distance measure)を利用して、最も少ないエラーを有するコードブックインデックスを選択する過程を意味する。しかし、LPC係数において、全ての係数の重要度が異なるので、重要な係数のエラーを減少させれば、最終合成信号の知覚的な品質(perceptual quality)が向上する。従って、LSF係数を量子化するとき、復号装置は、各LPC係数の重要度を表現する加重関数(weighting function)を二乗誤差距離尺度に適用し、最適のコードブックインデックスを選択することにより、合成信号の性能を向上させることができる。
一実施形態によれば、ISFやLSFの周波数情報と、実際スペクトルサイズとを利用して、各ISFまたはLSFが、実際にスペクトル包絡線にいなかる影響を与えるかということについての大きさ加重関数を決定することができる。一実施形態によれば、周波数ドメインの知覚的な特性及びフォルマント分布を考慮した周波数加重関数を、大きさ加重関数と組み合わせ、さらなる量子化効率を得ることができる。それによれば、実際周波数ドメインの大きさを使用するので、全体周波数の包絡線情報が良好に反映され、各ISF係数またはLSF係数の加重値を正確に導き出すことができる。一実施形態によれば、大きさ加重関数及び周波数加重関数に、LSF係数あるいはISF係数の位置情報に基づいた加重関数を組み合わせ、さらなる量子化効率を得ることができる。
一実施形態によれば、LPC係数を変換したISFまたはLSFをベクトル量子化するとき、各係数の重要度が異なる場合、ベクトル内において、いかなるエントリーが相対的にさらに重要であるか否かということを示す加重関数を決定することができる。そして、符号化するフレームのスペクトルを分析し、エネルギーが大きい部分にさらに大きい加重値を与える加重関数を決定することにより、符号化の正確度を向上させることができる。スペクトルのエネルギーが大きいということは、時間ドメインにおいて、相関度が高いということを意味する。
表1において、全てのモードに適用されるVQにおいて、最適量子化インデックスは、下記数式(1)のEwerr(p)を最小化するインデックスと決定することができる。
ここで、w(i)は、加重関数を意味する。r(i)は、量子化器の入力を示し、c(i)は、量子化器の出力を示し、2つの値間の加重された歪曲を最小化するインデックスを求めるためのものである。
次に、BC−TCQで使用される歪曲尺度は、基本的に、US7,630,890に開示された方式による。そのとき、歪曲尺度d(x,y)は、下記数式(2)のように示すことができる。
一実施形態によれば、歪曲尺度d(x,y)に加重関数を適用することができる。US7,630,890において、BC−TCQのために使用された歪曲尺度を、ベクトルに係わる尺度に拡張した後で加重関数を適用し、加重された歪曲を求めることができる。すなわち、BC−TCVQの全てのステージにおいて、下記数式(3)のように、加重された歪曲を求め、最適のインデックスを決定することができる。
一方、ISF/LSF量子化部350は、入力された符号化モードによって、例えば、LVQ(lattice vector quantizer)とBC−TCVQとをスイッチングし、量子化を行うことができる。もし符号化モードがGCモードであるならば、LVQを利用し、VCモードであるならば、BC−TCVQを利用することができる。LVQとBC−TCVQとが混合しているとき、量子化器選択過程について具体的に説明すれば、次の通りである。まず、符号化するビットレートを選択することができる。符号化するビットレートが選択されれば、各ビットレートに該当するLPC量子化器のためのビットを決定することができる。その後、入力信号の帯域を決定することができる。入力信号が狭帯域であるか広帯域であるかということにより、量子化方式が変更される。また、入力信号が広帯域である場合、追加して実際に符号化する帯域の上限(upper limit)が6.4KHzであるか、あるいは8kHzであるかということを判断する必要がある。すなわち、内部サンプリング周波数が、12.8kHzであるか16kHzであるかということにより、量子化方式が変更されるので、帯域を確認する必要がある。次に、決定された帯域によって使用可能な符号化モードの限度内で、最適な符号化モードを決定することができる。例えば、4種符号化モード(UC,VC,GC,TC)を使用することができるが、高いビットレート(例えば、9.6kbit/s以上)では、3種モードだけ(VC,GC,TC)を使用することができる。符号化するビットレート、入力信号の帯域、符号化モードに基づいて、量子化方式、例えば、LVQとBC−TCVQとのうち一つを選択し、選択された量子化方式に基づいて量子化されたインデックスを出力する。
一実施形態によれば、ビットレートが、24.4kbpsと64kbpsとの間に該当するか否かということを判断し、ビットレートが、24.4kbpsと64kbpsとの間に該当しければLVQを選択することができる。一方、ビットレートが2、4.4kbpsと64kbpsとの間に該当すれば、入力信号の帯域が狭帯域であるか否かということを判断し、入力信号の帯域が狭帯域であるならば、LVQを選択することができる。一方、入力信号の帯域が狭帯域ではなければ、符号化モードがVCモードであるか否かということを判断し、符号化モードがVCモードである場合、BC−TCVQを使用し、符号化モードがVCモードではなければ、LVQを使用することができる。
他の実施形態によれば、ビットレートが、13.2kbpsと32kbpsとの間に該当するか否かということを判断し、ビットレートが、13.2kbpsと32kbpsとの間に該当しなければ、LVQを選択することができる。一方、ビットレートが、13.2kbpsと32kbpsとの間に該当すれば、入力信号の帯域が広帯域であるか否かということを判断し、入力信号の帯域が広帯域ではなければ、LVQを選択することができる。一方、入力信号の帯域が広帯域であるならば、符号化モードが、VCモードであるか否かということを判断し、符号化モードがVCモードである場合、BC−TCVQを使用し、符号化モードがVCモードではなければ、LVQを使用することができる。
一実施形態によれば、符号化装置は、LPC係数から変換されたISF係数またはLSF係数の周波数に該当するスペクトルサイズを利用した大きさ加重関数、入力信号の知覚的な特性及びフォルマント分布を考慮した周波数加重関数、LSF係数あるいはISF係数の位置に基づいた加重関数を組み合わせ、最適の加重値関数を決定することができる。
図4は、一実施形態による、図3の加重関数決定部の構成を示したブロック図である。図4に図示された加重関数決定部400は、スペクトル分析部410、LP分析部430、第1加重関数生成部450、第2加重関数生成部470及び組み合わせ部490を含んでもよい。各構成要素は、少なくとも1つのプロセッサに一体化されても具現される。
図4を参照すれば、スペクトル分析部410は、時間−周波数(time-to-frequency)マッピング過程を介して、入力信号に係わる周波数ドメインの特性を分析することができる。ここで、該入力信号は、前処理された信号でもある、時間−周波数マッピング過程は、FFTを利用して遂行されるが、それに限定されるものではない。スペクトル分析部410は、スペクトル分析情報、一例として、FFTの結果として得られるスペクトルサイズを提供することができる。ここで、該スペクトルサイズは、線形スケールを有することができる。具体的には、スペクトル分析部410は、128ポイントFFTを行い、スペクトルサイズを生成することができる。そのとき、該スペクトルサイズの帯域幅は、0ないし6,400Hzの範囲に該当する。このとき、内部サンプリング周波数が16kHzである場合、スペクトルサイズの数は、160個に拡張される。その場合、6,400ないし8,000Hz範囲に係わるスペクトルサイズが漏れるが、漏れたスペクトルサイズは、入力スペクトルによって生成される。具体的には、4,800ないし6,400Hzの帯域幅に該当する最後の32個のスペクトルサイズを利用して、6,400ないし8,000Hz範囲の漏れたスペクトルサイズを代替することができる。一例として、最後の32個のスペクトルサイズの平均値を使用することができる。
LP分析部430は、入力信号に対してLP分析を行い、LPC係数を生成することができる。LP分析部430は、LPC係数から、ISF係数あるいはLSF係数を生成することができる。
第1加重関数生成部450は、ISF係数あるいはLSF係数に対して、スペクトル分析情報に基づいて、大きさ加重関数と周波数加重関数とを得て、大きさ加重関数と周波数加重関数とを組み合わせ、第1加重関数を生成することができる。第1加重関数は、FFTを基に得られ、スペクトルサイズが大きいほど、大きい加重値を割り当てることができる。一例を挙げれば、第1加重関数は、スペクトル分析情報、すなわち、スペクトルサイズを、ISF帯域あるいはLSF帯域に合うように正規化した後、各ISF係数あるいはLSF係数に該当する周波数の大きさを利用して決定される。
第2加重関数生成部470は、隣接したISF係数あるいはLSF係数の間隔あるいは位置情報に基づいて、第2加重関数を決定することができる。一実施形態によれば、それぞれのISF係数あるいはLSF係数と隣接した2つのISF係数あるいはLSF係数から、スペクトル敏感度に係わる第2加重関数を生成することができる。一般的には、ISF係数あるいはLSF係数は、Zドメインの単位サークル上に位置し、隣接したISF係数あるいはLSF係数の間隔が周辺より狭い場合、スペクトルピークとして示される特徴がある。結果的には、第2加重関数は、隣接したLSF係数の位置に基づいて、LSF係数のスペクトル敏感度を近似化することができる。すなわち、隣接したLSF係数がどれほど近くに位置するかということを測定することにより、LSF係数の稠密度が予測され、稠密なLSF係数が存在する周波数近くで、信号スペクトルがピーク値を有することができるので、大きい値の加重値が割り当てられる。ここで、スペクトル敏感度の近似化時、正確度を高めるために、第2加重関数の決定時、LSF係数に係わる多様なパラメータが追加して使用される。
前述のところによれば、ISF係数あるいはLSF係数の間隔と加重関数は、反比例関係が成立する。そのような間隔と加重関数との関係を利用して、多様な実施形態が可能である。一例を挙げれば、間隔を負数で表現するか、あるいは間隔を分母に表示することができる。他の例を挙げれば、求められた加重値をさらに強調するために、加重関数のそれぞれのエレメントに定数を乗じるか、あるいはエレメントの二乗で示す場合も可能である。さらに他の例を挙げれば、一次的に求められた加重関数自体に対して、さらなる演算、例えば、累乗あるいは三乗などを行い、二次的に求められた加重関数をさらに反映することができる。
ISF係数あるいはLSF係数の間隔を利用して、加重関数を導き出す例は、次の通りである。
一例によれば、第2加重関数(Ws(n))は、下記数式(4)によって求められる。
ここで、lsfi−1及びlsfi+1は、現在LSF係数lsfに隣接したLSF係数を示す。
他の例によれば、第2加重関数(Ws(n))は、下記数式(5)によって求められる。
ここで、lsfは、現在LSF係数を示し、lsfn−1及びlsfn+1は、隣接したLSF係数を示し、Mは、LPモデルの次数であって、16でもある。例えば、LSF係数は、0ないしπの間でスパンされるので、最初及び最後の加重値は、lsf=0、lsf=πに基づいて算出される。
組み合わせ部490は、第1加重関数と第2加重関数とを組み合わせ、LSF係数の量子化に使用される最終加重関数を決定することができる。そのとき、結合方式としては、それぞれの加重関数を乗じるか、適切な比率を乗じた後で加えるか、あるいはそれぞれの加重値に対して、ルックアップテーブルなどを利用してあらかじめ決定された値を乗じた後、それらを加える方式など多様な方式を使用することができる。
図5は、一実施形態による、図4の第1加重関数生成部の細部構成を示したブロック図である。図5に図示された第1加重関数生成部500は、正規化部510、大きさ加重関数生成部530、周波数加重関数生成部550及び組み合わせ部570を含んでもよい。ここで、説明の便宜のために、第1加重関数生成部500の入力信号として、LSF係数を例として挙げる。
図5を参照すれば、正規化部500は、LSF係数を、0ないし(K−1)の範囲に正規化することができる。LSF係数は、一般的には、0ないしπまでの範囲を有することができる。12.8kHz内部サンプリング周波数である場合、Kは、128であり、16.4kHz内部サンプリング周波数である場合、Kは、160でもある。
大きさ加重関数生成部530は、正規化されたLSF係数に対して、スペクトル分析情報に基づいて、大きさ加重値関数W(n)を生成することができる。一実施形態によれば、大きさ加重関数は、正規化されたLSF係数のスペクトルサイズに基づいて決定される。
具体的には、大きさ加重関数は、正規化されたLSF係数の周波数に対応するスペクトルビンの大きさと、当該スペクトルビンの左右、例えば、一つ以前あるいは一つ以後に位置する隣接する2つのスペクトルビンの大きさを使用して決定される。スペクトルエンベロープに係わる各大きさの加重値関数W(n)は、3個のスペクトルビンの大きさのうち最大値を抽出し、下記数式(6)に基づいて決定される。
ここで、Minは、w(n)の最小値を示し、w(n)は、10log(Emax(n))(ここで、n=0、…、M−1)と定義される。ここで、Mは、16であり、Emax(n)は、各LSF係数に係わる3個のスペクトルビンの大きさのうち最大値を示す。
周波数加重関数生成部550は、正規化されたLSF係数について、周波数情報に基づいて、周波数加重関数W(n)を生成することができる。一実施形態によれば、周波数加重関数は、入力信号の知覚的な特性及びフォルマント分布を利用して決定することができる。周波数加重関数生成部550は、バークスケール(bark scale)によって、入力信号の知覚的な特性を抽出することができる。そして、周波数加重関数生成部550は、フォルマント分布のうち最初のフォルマントに基づいて、周波数別加重関数を決定することができる。周波数加重関数の場合、超低周波及び高周波において、相対的に低い加重値を示し、低周波において、一定周波数区間内、例えば、最初のフォルマントに該当する区間において、同一サイズの加重値を示すことができる。周波数加重関数生成部550は、入力帯域幅及び符号化モードにより、周波数加重関数を決定することができる。
組み合わせ部570は、大きさ加重関数W(n)と周波数加重関数W(n)とを組み合わせ、FFT基盤加重関数W(n)を決定することができる。組み合わせ部570は、大きさ加重関数と周波数加重関数とを乗じたり加えたりして、最終的な加重関数を決定することができる。例えば、フレームエンドLSF量子化のためのFFT基盤加重関数W(n)は、下記数式(7)に基づいて算出される。
図6は、一実施形態によるLPC係数量子化部の構成を示したブロック図である。図6に図示されたLPC係数量子化部600は、選択部610、第1量子化モジュール630及び第2量子化モジュール650を含んでもよい。
図6を参照すれば、選択部610は、オープンループ方式で、所定基準に基づいて、フレーム間予測を使用しない量子化処理と、フレーム間予測を使用する量子化処理とのうち一つを選択することができる。ここで、所定基準は、量子化されていないLSFの予測エラーが使用される。該予測エラーは、フレーム間予測値に基づいて得られる。
第1量子化モジュール630は、フレーム間予測を使用しない量子化処理が選択された場合、選択部610を介して提供される入力信号を量子化することができる。
第2量子化モジュール650は、フレーム間予測を使用する量子化処理が選択された場合、選択部610を介して提供される入力信号を量子化することができる。
第1量子化モジュール630は、フレーム間予測を使用せずに量子化を行い、セーフティネットスキームと命名することができる。第2量子化モジュール650は、フレーム間予測を使用して量子化を行い、予測スキームと命名することができる。
それによれば、効率性が高い対話型音声サービスのための低ビット率から、差別化された品質のサービスを提供するための高ビット率まで、多様なビット率に対応し、最適の量子化器が選択される。
図7は、一実施形態による、図6の選択部の構成を示したブロック図である。図7に図示された選択部700は、予測エラー算出部710と量子化スキーム選択部730とを含んでもよい。ここで、予測エラー算出部710は、図6の第2量子化モジュール650に含まれもする。
図7を参照すれば、予測エラー算出部710は、フレーム間予測値p(n)、加重関数w(n)、DC値が除去されたLSF係数z(n)を入力にして、多様な方法に基づいて予測エラーを算出することができる。まず、フレーム間予測器は、第2量子化モジュール650の予測スキームで使用されるものと同一のものを使用することができる。ここで、AR(auto-regressive)方式とMA(moving average)方式とのうちいずれを使用してもよい。フレーム間予測のための以前フレームの信号z(n)は、量子化された値を使用することもでき、量子化されていない値を使用することもできる。また、予測エラーを求めるとき、加重関数を適用しても適用しなくともよい。それによれば、全体8種の組み合わせが可能であり、そのうち4種は、次の通りである。
第1に、以前フレームの量子化されたz(n)信号を利用した加重AR予測エラーは、下記数式(8)のように示すことができる。
第2に、以前フレームの量子化されたz(n)信号を利用したAR予測エラーは、下記数式(9)のように示すことができる。
第3に、以前フレームのz(n)信号を利用した加重AR予測エラーは、下記数式(10)のように示すことができる。
第4に、以前フレームのz(n)信号を利用したAR予測エラーは、下記数式(11)のように示すことができる。
ここで、Mは、LSFの次数を意味し、入力音声信号の帯域幅がWBである場合、一般的には、16を使用する。ρ(i)は、AR方式の予測係数を意味する。このように、直前フレームの情報を利用する場合が一般的であり、ここで求められた予測エラーを利用して、量子化スキームを決定することができる。
一方、予測エラーが所定臨界値より大きければ、それは、現在フレームが非静的(non-stationary)になる傾向があるということを暗示することができる。その場合、セーフティネットスキームを使用することができる。それ以外には、予測スキームを使用するが、そのとき予測スキームが連続的に選択されないように制限を加えることができる。
一実施形態によれば、以前フレームに対してフレームエラーが発生し、以前フレームの情報がない場合に備え、以前フレームの以前フレームを利用して、第2予測エラーを求め、第2予測エラーを利用して、量子化スキームを決定することができる。その場合、第2予測エラーは、前述の第1の場合と比較し、下記数式(12)のように示すことができる。
量子化スキーム選択部730は、予測エラー算出部710で求められた予測エラーを利用して、現在フレームの量子化スキームを決定することができる。そのとき、符号化モード決定部110(図1)で求められた符号化モードをさらに考慮することができる。一実施形態によれば、VCモードあるいはGCモードの場合、量子化スキーム選択部730が動作することができる。
図8は、図6の選択部の動作について説明するフローチャートである。予測モードが0値を有する場合は、常にセーフティネットスキームを使用することを意味し、予測モードが0ではない値を有する場合は、セーフティネットスキームと予測スキームとをスイッチングし、量子化スキームを決定することを意味する。常にセーフティネットスキームを使用する符号化モードの例としては、UCモードあるいはTCモードを挙げることができる。一方、セーフティネットスキームと予測スキームとをスイッチングして使用する符号化モードの例としては、VCモードあるいはGCモードを挙げることができる。
図8を参照すれば、810段階においては、現在フレームの予測モード(prediction mode)が0であるか否かということを判断する。810段階での判断結果、予測モードが0である場合、例えば、UCモードあるいはTCモードのように、現在フレームが変動性が大きい場合には、フレーム間予測が困難であるために、常にセーフティネットスキーム、すなわち、第1量子化モジュール630を選択することができる(850段階)。
一方、810段階での判断結果、予測モードが0ではない場合、予測エラーを考慮し、セーフティネットスキームと予測スキームとのうち一つを量子化スキームとして決定することができる。そのために、830段階においては、予測エラーが、所定の臨界値より大きいか否かということを判断する。ここで、臨界値は、前もって実験的に、あるいはシミュレーションを介して最適値に決定される。一例を挙げれば、次数が16であるWBの場合、臨界値の例として、3、784、536.3を設定することができる。一方、予測スチームを連続して選択しないように制限を加えることができる。
830段階での判断結果、予測エラーが臨界値より大きいか、あるいはそれと同じ場合、セーフティネットスキームを選択することができる(850段階)。一方、830段階での判断結果、予測エラーが臨界値より小さい場合、予測スキームを選択することができる(870段階)。
図9Aないし図9Dは、図6に図示された第1量子化モジュールの多様な具現例を示したブロック図である。実施形態によれば、第1量子化モジュールの入力として、16次数のLSFベクトルが使用されることとする。
図9Aに図示された第1量子化モジュール900は、全体入力ベクトルの概略をTCQ(trellis coded quantizer)を利用して量子化する第1量子化部911と、量子化エラー信号を追加して量子化する第2量子化部913と、を含んでもよい。第1量子化部911は、TCQ、TCVQ(trellis coded vector quantizer)、BC−TCQ(block-constrained trellis coded quantizer)またはBC−TCVQのように、トレリス構造を使用する量子化器によって具現される。第2量子化部913は、ベクトル量子化器あるいはスカラ量子化器によって具現されるが、それらに限定されるものではない。メモリサイズを最小化しながら、性能向上のためにSVQ(split vector quantizer)を使用するか、あるいは性能向上のために、MSVQ(multi-stage vector quantizer)を使用することもできる。第2量子化部913を、SVQあるいはMSVQで具現する場合、複雑度に対する余裕があれば、2個以上の候補を保存し、最適コードブックインデックス探索を行う軟判定(soft decision)技術を使用することもできる。
第1量子化部911及び第2量子化部913の動作は、次の通りである。
まず、量子化されていないLSF係数から、前もって定義された平均値を除外し、z(n)信号を得ることができる。第1量子化部911においては、z(n)信号の全体ベクトルに対して、量子化及び逆量子化を行うことができる。ここで、使用される量子化器の例としては、BC−TCQあるいはBC−TCVQが挙げられる。量子化エラー信号を求めるために、z(n)信号と、逆量子化された信号との差値を利用し、r(n)信号を得ることができる。r(n)信号は、第2量子化部913の入力として提供される。第2量子化部913は、SVQまたはMSVQなどで具現することができる。第2量子化部913で量子化された信号は、逆量子化を経た後、第1量子化部911で逆量子化された結果と加えられた後、量子化されたz(n)値になり、それに平均値を加えれば、量子化されたLSF値を求めることができる。
図9Bに図示された第1量子化モジュール900は、第1量子化部931及び第2量子化部933に、フレーム内予測器932をさらに含んでもよい。第1量子化部931と第2量子化部933は、図9Aの第1量子化部911及び第2量子化部913に対応する。LSF係数は、毎フレームごとに符号化が行われるので、フレーム内において、10次あるいは16次のLSF係数を利用して予測を行うことができる。図9Bによれば、z(n)信号は、第1量子化部931及びフレーム内予測器932を介して量子化される。フレーム内予測のために使用される過去信号は、TCQを介して量子化された以前ステージのt(n)値を使用する。フレーム内予測で使用される予測係数は、前もってコードブック訓練過程を介して前もって定義される。TCQにおいては、一般的には、一次が使用され、場合によっては、さらに高い次数あるいは次元を使用することもできる。TCVQにおいては、ベクトルであるので、予測係数がベクトルの次元サイズに該当する二次元マトリックス形態にもなる。ここで、次元は、2以上の自然数にもなる。例えば、VQの次元が2である場合には、2X2サイズのマトリックスを利用した予測係数をあらかじめ求める必要がある。一実施形態によれば、TCVQが二次元を利用しているしフレーム内予測器932は、2X2サイズを有する。
TCQのフレーム内予測過程は、次の通りである。第1量子化部931、すなわち、第1 TCQの入力信号であるt(n)は、下記数式(13)のように求めることができる。
一方、二次元を使用するTCVQのフレーム内予測過程は、次の通りである。第1量子化部931、すなわち、第1 TCQの入力信号であるt(n)は、下記数式(14)のように求めることができる。
ここで、Mは、LSF係数の次数を示し、狭帯域である場合、10を使用し、広帯域である場合、16を使用し、ρは、一次元の予測係数を示し、Aは、2X2の予測係数を示す。
第1量子化部931は、予測エラーベクトルt(n)を量子化することができる。一実施形態によれば、第1量子化部931は、TCQを使用して具現され、具体的には、BC−TCQ、BC−TCVQ、TCQ、TCVQが挙げられる。第1量子化部931と共に使用されたフレーム内予測器932は、入力ベクトルの各エレメント単位またはサブベクトル単位で、量子化過程と予測過程とを反復することができる。第2量子化部933の動作は、図9Aの第2量子化部913と同一である。
図9Cは、図9Aの構造において、コードブック共有のための第1量子化モジュール900を示す。第1量子化モジュール900は、第1量子化部951及び第2量子化部953を含んでもよい。音声/オーディオ符号化器において、マルチレート符号化を支援する場合、同一LSF入力ベクトルを多様なビットに量子化する技術を必要とする。その場合、使用する量子化器のコードブックメモリを最小化しながら、効率的な性能を有するために、1つの構造で2つのビット数割り当てが可能になるように具現することができる。ここで、f(n)は、高レート出力を意味し、f(n)は、ローレート出力を意味する。そのうち、BC−TCQ/BC−TCVQのみを利用した場合、ここに使用されるビット数だけで、ローレートのための量子化を行うことができる。それに加え、さらに精密な量子化が必要な場合には、第1量子化部951のエラー信号を、さらなる第2量子化部953を利用して量子化することができる。
図9Dは、図9Cの構造において、フレーム内予測器972をさらに含んだものである。第1量子化モジュール900は、第1量子化部971及び第2量子化部973に、フレーム内予測器972をさらに含んでもよい。第1量子化部971と第2量子化部973は、図9Cの第1量子化部951及び第2量子化部953に対応する。
図10Aないし図10Dは、図6に図示された第2量子化モジュールの多様な具現例を示したブロック図である。
図10Aに図示された第2量子化モジュール1000は、図9Bの構造に、フレーム間予測器1014をさらに追加したものである。図10Aに図示された第2量子化モジュール1000は、第1量子化部1011及び第2量子化部1013に、フレーム間予測器1014をさらに含んでもよい。フレーム間予測器1014は、以前フレームで量子化されたLSF係数を利用して、現在フレームを予測する技術である。フレーム間予測過程は、以前フレームの量子化された値を利用して、現在フレームから除き、量子化が終われば、その寄与分をさらに加える方式である。そのとき、予測係数は、各エレメント別に求められる。
図10Bに図示された第2量子化モジュール1000は、図10Aの構造に、フレーム内予測器1032をさらに追加したものである。図10Bに図示された第2量子化モジュール1000は、第1量子化部1031、第2量子化部1033、フレーム間予測器1034に、フレーム内予測器1032をさらに含んでもよい。
図10Cは、図10Bの構造において、コードブック共有のための第2量子化モジュール1000を示す。すなわち、図10Bの構造において、BC−TCQ/BC−TCVQのコードブックを、ローレート及びハイレートで共有する構造を示す。図10Cにおいて上側は、第2量子化部(図示せず)を使用せずにローレートに係わる出力を意味し、下側は、第2量子化部1063を使用するハイレートに係わる出力を意味する。
図10Dは、図10Cの構造において、フレーム内予測器を除外し、第2量子化モジュール1000を具現した例を示す。
図11Aないし図11Fは、BC−TCVQに加重値を適用する量子化器1100の多様な具現例を示したブロック図である。
図11Aは、基本的なBC−TCVQ量子化器を示したものであり、加重関数算出部1111とBC−TCVQ部1112を含んでもよい。BC−TCVQにおいて、最適インデックスを求めるとき、加重された歪曲を最小化するインデックスを求めることになる。図11Bは、図11Aにおいて、フレーム内予測器1123を追加した構造を示す。ここで使用されるフレーム内予測は、AR方式を利用することもでき、MA方式を利用することもできる。一実施形態によれば、AR方式を利用して、使用される予測係数は、あらかじめ定義される。
図11Cは、図11Bにおいて、さらなる性能向上のために、フレーム間予測器1134を追加した構造を示す。図11Cは、予測スキームで使用される量子化器の例を示す。ここで使用されるフレーム間予測は、AR方式を利用することもでき、MA方式を利用することもできる。一実施形態によれば、AR方式を利用して、使用される予測係数は、あらかじめ定義される。量子化過程について述べれば、まず、フレーム間予測を利用して予測された予測エラー値は、フレーム内予測を利用するBC−TCVQを利用して量子化することができる。量子化インデックス値は、復号器に伝送される。復号過程について述べれば、量子化されたBC−TCVQの結果にフレーム内予測値を加えて量子化されたr(n)値を求める。ここに、フレーム間予測器1134の予測値を加えた後、平均値を加えれば、最終量子化されたLSF値が決定される。
図11Dは、図11Cにおいて、フレーム内予測器を除いた構造を示す。図11Eは、第2量子化部1153が追加された場合、加重値をいかように適用するかということに係わる構造を示す。加重関数算出部1151で求められた加重関数は、第1量子化部1152及び第2量子化部1153のいずれでも使用され、最適インデックスは、加重された歪曲を利用して求める。第1量子化部1151は、BC−TCQ、BC−TCVQ、TCQまたはTCVQによって具現される。第2量子化部1153は、SQ、VQ、SVQまたはMSVQによって具現される。図11Fは、図11Eにおいて、フレーム内予測器が除かれた構造を示す。
図11Aないし図11Fで言及された多様な構造の量子化器形態を組み合わせ、スイッチング構造の量子化器を具現することができる。
図12は、一実施形態による、ローレートでオープンループ方式のスイッチング構造を有する量子化装置の構成を示すブロック図である。図12に図示された量子化装置1200は、選択部1210、第1量子化モジュール1230及び第2量子化モジュール1250を含んでもよい。
選択部1210は、予測エラーに基づいて、セーフティネットスキームあるいは予測スキームのうち一つを量子化スキームとして選択することができる。
第1量子化モジュール1230は、セーフティネットスキームが選択された場合、フレーム間予測を使用せずに量子化を行うものであり、第1量子化部1231及び第1フレーム内予測器1232を含んでもよい。具体的には、LSFベクトルは、第1量子化部1231及び第1フレーム内予測器1232によって、30ビットに量子化される。
第2量子化モジュール1250は、予測スキームが選択された場合、フレーム間予測を使用して量子化を行うものであり、第2量子化部1251、第2フレーム内予測器1252及びフレーム間予測器1253を含んでもよい。具体的には、平均値が除去されたLSFベクトルと、予測ベクトルとの差に該当する予測エラーは、第2量子化部1251及び第2フレーム内予測器1252によって、30ビットに量子化される。
図12に図示された量子化装置は、VCモードである場合、31ビットを使用するLSF係数量子化の例を示す。図12の量子化装置において、第1量子化部1231及び第2量子化部1251は、図13の量子化装置において、第1量子化部1331及び第2量子化部1351とコードブックを共有することができる。動作について述べれば、入力されたLSF値f(n)から平均値を除外し、z(n)信号を得ることができる。選択部1210においては、以前フレームで復号されたz(n)値を利用して、フレーム間予測したp(n)値、z(n)値、加重関数、予測モード(pred_mode)を利用して、最適量子化スキームを選択あるいは決定することができる。選択あるいは決定された結果によって、セーフティネットスキームあるいは予測スキームのうち一つを利用して量子化を行うことができる。選択あるいは決定された量子化スキームは、1ビットに符号化される。
選択部1210において、セーフティネットスキームに選択されれば、平均値が除去されたLSF係数であるz(n)の全体入力ベクトルは、第1フレーム内予測器1232を介して、30ビットを使用する第1量子化部1231を利用して量子化が行われる。一方、選択部1210において、予測スキームに選択されれば、平均値が除去されたLSF係数であるz(n)は、フレーム間予測器1253を利用した予測エラー信号を、第2フレーム内予測器1252を介して、30ビットを使用する第2量子化部1251を利用して量子化が行われる。第1量子化部1231、第2量子化部1251の例としては、TCQ、TCVQの形態を有する量子化器が可能である。具体的には、BC−TCQまたはBC−TCVQなどが可能である。その場合、該量子化器は、総31ビットを利用する。量子化された結果は、ローレートの量子化器出力として使用され、量子化器の主要出力は、量子化されたLSFベクトル及び量子化インデックスである。
図13は、一実施形態による、ハイレートでオープンループ方式のスイッチング構造を有する量子化装置の構成を示すブロック図である。図13に図示された量子化装置1300は、選択部1310、第1量子化モジュール1330及び第2量子化モジュール1350を含んでもよい。図12と比較するとき、第1量子化モジュール1330に第3量子化部1333が追加され、第2量子化モジュール1350に第4量子化部1353の追加されたという違いがある。図12及び図13において、第1量子化部1231,1331と、第2量子化部1251,1351は、それぞれ同一コードブックを使用することができる。すなわち、図12の31ビットLSF量子化装置1200と、図13の41ビットLSF量子化装置1300は、BC−TCVQについて、同一コードブックを使用することができる。それによれば、最適コードブックというものではないが、メモリサイズを大幅に節減することができる。
選択部1310は、予測エラーに基づいて、セーフティネットスキームあるいは予測スキームのうち一つを量子化スキームとして選択することができる。
第1量子化モジュール1330は、セーフティネットスキームが選択された場合、フレーム間予測を使用せずに量子化を行うものであり、第1量子化部1331、第1フレーム内予測器1332及び第3量子化部1333を含んでもよい。
第2量子化モジュール1350は、予測スキームが選択された場合、フレーム間予測を使用して量子化を行うものであり、第2量子化部1351、第2フレーム内予測器1352、第4量子化部1353及びフレーム間予測器1354を含んでもよい。
図13に図示された量子化装置は、VCモードである場合、41ビットを使用するLSF係数量子化の例を示す。図13の量子化装置1300において、第1量子化部1331及び第2量子化部1351は、図12の量子化装置1200において、第1量子化部1231及び第2量子化部1251とそれぞれコードブックを共有することができる。動作について述べれば、入力されたLSF値f(n)から平均値を除去すれば、z(n)信号になる。選択部1310においては、以前フレームで復号されたz(n)値を利用してフレーム間予測したp(n)値、z(n)値、加重関数、予測モード(pred_mode)を利用して、最適量子化スキームを決定することができる。選択あるいは決定された結果によって、セーフティネットスキームあるいは予測スキームのうち一つを利用して量子化を行うことができる。選択あるいは決定された量子化スキームは、1ビットに符号化される。
選択部1310において、セーフティネットスキームに選択されれば、平均値が除去されたLSF係数であるz(n)の全体入力ベクトルは、第1フレーム内予測器1332を介して、30ビットを使用する第1量子化部1331を利用して、量子化及び逆量子化が行われる。一方、原信号と、逆量子化された結果との差を示す第2エラーベクトルは、第3量子化部1333の入力として提供される。第3量子化部1333においては、第2エラーベクトルを、10ビットを使用して量子化することができる。第3量子化部1333の例としては、SQ、VQ、SVQまたはMSVQなどが可能である。量子化及び逆量子化が終われば、次のフレームのために、最終的に量子化されたベクトルが保存される。
一方、選択部1310において、予測スキームに選択されれば、平均値が除去されたLSF係数であるz(n)から、フレーム間予測器1354からのp(n)を減算して得られた予測エラー信号を、30ビットを使用して、第2量子化部1351及び第2フレーム内予測器1352によって、量子化あるいは逆量子化される。第1量子化器1231、第2量子化部1351の例としては、TCQ、TCVQの形態を有する量子化器が可能である。具体的には、BC−TCQまたはBC−TCVQなどが可能である。一方、原信号と、逆量子化された結果との差を示す第2エラーベクトルは、第4量子化部1353の入力として提供される。第4量子化部1353においては、第2エラーベクトルを、10ビットを使用して量子化することができる。ここで、第2エラーベクトルは、8X8次元の2つのサブベクトルに分割され、第4量子化部1353で量子化される。低帯域が高帯域より認知的に重要であるために、最初のVQ及び2番目のVQに、互いに異なるビット数を割り当てて符号化することができる。第4量子化部1353の例としては、SQ、VQ、SVQまたはMSVQなどが可能である。量子化及び逆量子化が終われば、次のフレームのために、最終的に量子化されたベクトルが保存される。
その場合、量子化器は、総41ビットを利用する。量子化された結果は、ハイレートの量子化器出力として使用され、量子化器の主要出力は、量子化されたLSFベクトル及び量子化インデックスである。
結果として、図12と図13とを同時に使用する場合、図12の第1量子化部1231と、図13の第1量子化部1331とが量子化コードブックを共有し、図12の第2量子化部1251と、図13の第2量子化部1351とが量子化コードブックを共有すれば、全体的にコードブックメモリを大幅に節減することができる。一方、さらなるコードブックメモリ節減のために、図13の第3量子化部1333及び第4量子化部1353の量子化コードブックも共有される。その場合、第3量子化部1333の入力分布が、第4量子化部1353と異なるために、入力分布間の差を補償するために、スケーリングファクタが使用される。スケーリングファクタは、第3量子化部1333の入力と、第4量子化部1353の入力との分布を考慮して算出される。一実施形態によれば、第3量子化部1333の入力信号は、スケーリングファクタに分け、その結果として得られる信号を、第3量子化部1333で量子化することができる。第3量子化部1333で量子化された信号は、第3量子化部1333の出力を、スケーリングファクタに乗算して得ることができる。そのように、第3量子化部1333あるいは第4量子化部1353の入力に対して、適切なスケーリングを施した後、量子化を行えば、性能を最大限維持しながら、コードブックを共有することができる。
図14は、他の実施形態による、ローレートでオープンループ方式のスイッチング構造を有する量子化装置の構成を示すブロック図である。図14の量子化装置1400において、第1量子化モジュール1430及び第2量子化モジュール1450において、使用中の第1量子化部1431及び第2量子化部1451は、図9C及び図9Dのローレート部分が適用される。動作について述べれば、加重関数算出部1400においては、入力されたLSF値を利用して、加重関数w(n)を求めることができる。求められた加重関数w(n)は、選択部1410、第1量子化部1431及び第2量子化部1451で使用される。一方、LSF値f(n)から平均値を除去し、z(n)信号を得ることができる。選択部1410においては、以前フレームで復号されたz(n)値を利用してフレーム間予測したp(n)値、z(n)値、加重関数、予測モード(pred_mode)を利用して、最適量子化スキームを決定することができる。選択あるいは決定された結果によって、セーフティネットスキームあるいは予測スキームのうち一つを利用して量子化を行うことができる。選択あるいは決定された量子化スキームは、1ビットに符号化される。
選択部1410において、セーフティネットスキームに選択されれば、平均値が除去されたLSF係数であるz(n)は、第1量子化部1431で量子化される。第1量子化部1431は、図9C及び図9Dで説明したように、高い性能のために、フレーム内予測を使用することもでき、低い複雑度のために、除いて使用することもできる。フレーム内予測部を使用する場合には、全体入力ベクトルを、フレーム内予測を介して、TCQまたはTCVQを利用して量子化する第1量子化部1431に提供することができる。
選択部1410において、予測スキームに選択されれば、平均値が除去されたLSF係数であるz(n)は、フレーム間予測を利用した予測エラー信号を、フレーム内予測を介して、TCQまたはTCVQを利用して量子化する第2量子化部1451に提供することができる。第1量子化部1431、第2量子化部1451の例としては、TCQ、TCVQの形態を有する量子化器が可能である。具体的には、BC−TCQまたはBC−TCVQなどが可能である。量子化された結果は、ローレートの量子化器出力として使用される。
図15は、他の実施形態による、ハイレートでオープンループ方式のスイッチング構造を有する量子化装置の構成を示すブロック図である。図15に図示された量子化装置1500は、選択部1510、第1量子化モジュール1530及び第2量子化モジュール1550を含んでもよい。図14と比較するとき、第1量子化モジュール1530に第3量子化部1532が追加され、第2量子化モジュール1550に第4量子化部1552の追加されたという違いがある。図14及び図15において、第1量子化部1431,1531と第2量子化部1451,1551は、それぞれ同一コードブックを使用することができる。それによれば、最適コードブックというものではないが、メモリサイズを大幅に節減することができる。動作について述べれば、選択部1510において、セーフティネットスキームに選択されれば、第1量子化部1531において、第1量子化及び逆量子化を行い、原信号と逆量子化された結果との差を意味する第2エラーベクトルは、第3量子化部1532の入力として提供される。第3量子化部1532においては、第2エラーベクトルを量子化することができる。第3量子化部1532の例としては、SQ、VQ、SVQまたはMSVQなどが可能である。量子化及び逆量子化が終われば、次のフレームのために最終的に量子化されたベクトルが保存される。
一方、選択部1510において、予測スキームに選択されれば、第2量子化部1551においては、量子化及び逆量子化を行い、原信号と、逆量子化された結果との差を意味する第2エラーベクトルは、第4量子化部1552の入力として提供される。第4量子化部1552においては、第2エラーベクトルを量子化することができる。第4量子化部1552の例としては、SQ、VQ、SVQまたはMSVQなどが可能である。量子化及び逆量子化が終われば、次のフレームのために、最終的に量子化されたベクトルが保存される。
図16は、他の実施形態によるLPC係数量子化部の構成を示したブロック図である。図16に図示されたLPC係数量子化部1600は、選択部1610、第1量子化モジュール1630、第2量子化モジュール1650及び加重関数算出部1670を含んでもよい。図6に図示されたLPC係数量子化部600と比較するとき、加重関数算出部1670をさらに含むという違いがある。図16に係わる細部的具現例は、図11Aないし図11Fに図示されている。
図17は、一実施形態による、閉ループ方式のスイッチング構造を有する量子化装置の構成を示すブロック図である。図17に図示された量子化装置1700は、第1量子化モジュール1710、第2量子化モジュール1730及び選択部1750を含んでもよい。第1量子化モジュール1710は、第1量子化部1711、第1フレーム内予測器1712、及び第3量子化部1713を含み、第2量子化モジュール1730は、第2量子化部1731、第2フレーム内予測器1732、第4量子化部1733及びフレーム間予測器1734を含んでもよい。
図17を参照すれば、第1量子化モジュール1710において、第1量子化部1711においては、全体入力ベクトルを、第1フレーム内予測器1712を介して、BC−TCVQまたはBC−TCQを利用して量子化することができる。第3量子化部1713においては、量子化エラー信号をVQに量子化することができる。
第2量子化モジュール1730において、第2量子化部1731においては、フレーム間予測器1734を利用した予測エラー信号を、第2フレーム内予測器1732を介して、BC−TCVQまたはBC−TCQを利用して量子化することができる。第4量子化部1733においては、量子化エラー信号をVQに量子化することができる。
選択部1750は、第1量子化モジュール1710の出力と、第2量子化モジュール1730の出力とのうち一つを選択することができる。
図17において、セーフティネットスチームは、図9Bと同一であり、予測スキームは、図10Bと同一である。ここで、フレーム間予測は、AR方式とMA方式とのうち一つを利用することができる。一実施形態によれば、一次AR方式を利用した例を示す。予測係数は、あらかじめ定義され、予測のための過去ベクトルは、以前フレームにおいて、2つのスキームのうち最適ベクトルに選択されたベクトルを利用する。
図18は、他の実施形態による、閉ループ方式のスイッチング構造を有する量子化装置の構成を示すブロック図である。図17と比較するとき、フレーム内予測器を除いて具現した例である。図18に図示された量子化装置1800は、第1量子化モジュール1810、第2量子化モジュール1830及び選択部1850を含んでもよい。第1量子化モジュール1810は、第1量子化部1811及び第3量子化部1812を含み、第2量子化モジュール1830は、第2量子化部1831、第4量子化部1832及びフレーム間予測器1833を含んでもよい。
図18を参照すれば、選択部1850は、第1量子化モジュール1810の出力、及び第2量子化モジュール1830の出力を利用した加重された歪曲を入力にし、最適量子化スキームを選択あるいは決定することができる。最適量子化スキームを決定する過程について述べれば、次の通りである。
if ( ((predmode!=0) && (WDist[0]<PREFERSFNET*WDist[1]))
||(predmode == 0)
||(WDist[0]<abs_threshold) )
{
safety_net = 1;
}
else{
safety_net = 0;
}
ここで、予測モード(predmode)が0である場合には、常にセーフティネットスキームのみを使用するモードを意味し、0ではない場合には、セーフティネットスキームと予測スキームとをスイッチングして使用することを意味する。常にセーフティネットスキームのみを使用するモードの例としては、TCモードあるいはUCモードを挙げることができる。そして、WDist[0]は、セーフティネットスキームの加重された歪曲を意味し、WDist[1]は、予測スキームの加重された歪曲を意味する。また、abs_thresholdはあらかじめ設定された臨界値を示す。予測モードが0ではない場合は、フレームエラーを考慮し、セーフティネットスキームの加重された歪曲に優先し、最適量子化スキームを選択することができる。すなわち、基本的には、WDist[0]の値が、前もって定義された臨界値より小さいときは、WDist[1]の値に係わりなくセーフティネットスキームが選択される。それ以外の場合にも、単に加重された歪曲が少ないことを選択するものではなく、同一の加重された歪曲においては、セーフティネットスキームが選択される。その理由は、セーフティネットスキームが、フレームエラーにさらに強靭であるからである。従って、WDist[0]が、PREFERSFNET*WDist[1]より大きい場合にのみ、予測スキームが選択される。ここで、使用可能なPREFERSFNET=1.15である、それに限定されるものではない。そのように、量子化スキームが選択されれば、選択された量子化スキームを示すビット情報と、選択された量子化スキームに量子化して得られる量子化インデックスとを伝送することができる。
図19は、一実施形態による逆量子化装置の構成を示したブロック図である。図19に図示された逆量子化装置1900は、選択部1910、第1逆量子化モジュール1930及び第2逆量子化モジュール1950を含んでもよい。
図19を参照すれば、選択部1910は、ビットストリームに含まれた量子化スキーム情報に基づいて符号化されたLPCパラメータ、例えば、予測残差(prediction residual)を、第1逆量子化モジュール1930及び第2逆量子化モジュール1950のうち一つに提供することができる。一例として、量子化スキーム情報は、1ビットで表現される。
第1逆量子化モジュール1930は、符号化されたLPCパラメータを、フレーム間予測なしに逆量子化することができる。
第2逆量子化モジュール1950は、符号化されたLPCパラメータを、フレーム間予測を介して逆量子化することができる。
第1逆量子化モジュール1930と第2逆量子化モジュール1950は、復号装置に対応する符号化装置によって、前述の多様な実施形態のそれぞれ第1量子化モジュール及び第2量子化モジュールの逆処理に基づいて具現される。
図19の逆量子化装置は、量子化器構造が開ループ(open-loop)方式あるいは閉ループ(closed-loop)方式にかかわらずに適用することができる。
16kHz内部サンプリング周波数においてVCモードは、例えば、フレーム当たり31ビットと、フレーム当たり40あるいは41ビットとの2つのデコーディングレートを有することができる。VCモードは、16ステート8ステージBC−TCVQによって復号される。
図20は、一実施形態による逆量子化装置の細部的な構成を示したブロック図であり、31ビットのエンコーディングレートを使用する場合に該当する。図20に図示された逆量子化装置2000は、選択部2010、第1逆量子化モジュール2030及び第2逆量子化モジュール2050を含んでもよい。第1逆量子化モジュール2030は、第1逆量子化部2031及び第1フレーム内予測器2032を含んでもよく、第2逆量子化モジュール2050は、第2逆量子化部2051、第2フレーム内予測器2052及びフレーム間予測器2053を含んでもよい。図20の逆量子化装置は、図12の量子化装置に対応する。
図20を参照すれば、選択部2010は、ビットストリームに含まれた量子化スキーム情報に基づいて符号化されたLPCパラメータを、第1逆量子化モジュール2030及び第2逆量子化モジュール2050のうち一つに提供することができる。
量子化スキーム情報がセーフティネットスキームを示す場合、第1逆量子化モジュール2030において第1逆量子化部2031は、BC−TCVQを使用して逆量子化を行うことができる。第1逆量子化部2031及び第1フレーム内予測器2032を介して量子化されたLSF係数を得ることができる。量子化されたLSF係数に、所定DC値である平均値を加算すれば、最終復号されたLSF係数が生成される。
一方、量子化スキーム情報が予測スキームを示す場合、第2逆量子化モジュール2050において第2逆量子化部2051は、BC−TCVQを使用して逆量子化を行うことができる。逆量子化過程は、LSFベクトルのうち最も低いベクトルから始まり、フレーム内予測器2052は、復号されたベクトルを利用して、次の順序のベクトル要素のための予測値を生成する。フレーム間予測器2053は、以前フレームで復号されたLSF係数を利用して、フレーム間予測を介して、予測値を生成する。第2量子化部2051及びフレーム内予測器2052を介して得られる量子化されたLSF係数に、フレーム間予測器2053において得られるフレーム間予測値を加算し、加算結果に、所定のDC値である平均値を加えれば、最終復号されたLSF係数が生成される。
図21は、他の実施形態による逆量子化装置の細部的な構成を示したブロック図であり、41ビットのエンコーディングレートを使用する場合に該当する。図21に図示された逆量子化装置2100は、選択部2110、第1逆量子化モジュール2130及び第2逆量子化モジュール2150を含んでもよい。第1逆量子化モジュール2130は、第1逆量子化部2131、第1フレーム内予測器2132及び第3逆量子化部2133を含んでもよく、第2逆量子化モジュール2150は、第2逆量子化部2151、第2フレーム内予測器2152、第4逆量子化部2153及びフレーム間予測器2154を含んでもよい。図21の逆量子化装置は、図13の量子化装置に対応する。
図21を参照すれば、選択部2110は、ビットストリームに含まれた量子化スキーム情報に基づいて符号化されたLPCパラメータを、第1逆量子化モジュール2130及び第2逆量子化モジュール2150のうち一つに提供することができる。
量子化スキーム情報がセーフティネットスキームを示す場合、第1逆量子化モジュール2130において第1逆量子化部2131は、BC−TCVQを使用して、逆量子化を行うことができる。第3逆量子化部2133は、SVQを使用して逆量子化を行うことができる。第1逆量子化部2131及び第1フレーム内予測器2132を介して、量子化されたLSF係数を得ることができる。量子化されたLSF係数及び第3逆量子化部2133から得られる量子化されたLSF係数を加算し、該加算結果に、所定DC値である平均値を加えれば、最終復号されたLSF係数が生成される。
一方、量子化スキーム情報が予測スキームを示す場合、第2逆量子化モジュール2150において第2逆量子化部2151は、BC−TCVQを使用して、逆量子化を行うことができる。逆量子化過程は、LSFベクトルのうち最も低いベクトルから始まり、第2フレーム内予測器2152は、復号されたベクトルを利用して、次の順序のベクトル要素のための予測値を生成する。第4逆量子化部2153は、SVQを使用して、逆量子化を行うことができる。第2逆量子化部2151及び第2フレーム内予測器2152を介して得られる量子化されたLSF係数に、第4逆量子化部2153から提供される量子化されたLSF係数を加算することができる。フレーム間予測器2154は、以前フレームで復号されたLSF係数を利用して、フレーム間予測を介して、予測値を生成することができる。該加算結果に、フレーム間予測器2153で得られるフレーム間予測値を加え、所定DC値である平均値を加えれば、最終復号されたLSF係数が生成される。
ここで、第3逆量子化部2133と第4逆量子化部2153は、コードブックを共有することができる。
一方、図示されていないが、図19ないし図21の逆量子化装置は、図2に対応する復号装置の構成要素として使用される。
一方、LPC係数量子化/逆量子化に係わって採用されるBC−TCQに係わる内容は、「Block Constrained Trellis Coded Vector Quantization of LSF Parameters for Wideband Speech Codecs」(Jungeun Park and Sangwon Kang, ETRI Journal, Volume 30, Number 5, October 2008)に詳細に説明されている。一方、TCVQに係わる内容は、「Trellis Coded Vector Quantization」(Thomas R. Fischer et al, IEEE Transactions on Information Theory, Vol. 37, No. 6, November 1991)に詳細に説明されている。
前述の実施形態による量子化方法、逆量子化法、符号化方法及び復号方法は、コンピュータで実行されるプログラムに作成可能であり、コンピューターで読み取り可能な記録媒体を利用して、前記プログラムを動作させる汎用デジタルコンピュータで具現される。また、前述の本発明の実施形態で使用されるデータ構造、プログラム命令あるいはデータファイルは、コンピュータで読み取り可能な記録媒体に、多様な手段を介して記録される。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取り可能なデータが保存される全種の保存装置を含んでもよい。コンピュータで読み取り可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体(magnetic media);CD−ROM(compact disc read only memory)、DVD(digital versatile disc)のような光記録媒体(optical media);フロプティカルディスク(floptical disk)のような磁気・光媒体(magneto-optical media);及びROM(read only memory)、RAM(random access memory)、フラッシュメモリのような、プログラム命令を保存して遂行するように特別に構成されたハードウェア装置が含まれてもよい。また、コンピュータで読み取り可能な記録媒体は、プログラム命令、データ構造などを指定する信号を伝送する伝送媒体でもある。プログラム命令の例としては、コンパイラによって作われるような機械語コードだけではなく、インタープリタなどを使用して、コンピュータによって実行される高級言語コードを含んでもよい。
以上のように、本発明の一実施形態は、たとえ限定された実施形態及び図面によって説明されたにしても、本発明の一実施形態は、前述の実施形態に限定されるものではなく、本発明が属する分野で当業者であるならば、そのような記載から、多様な修正及び変形が可能であろう。従って、本発明のスコープは、前述の説明ではなく、特許請求の範囲に示されており、それと均等または等価的な変形は、いずれも本発明技術的思想の範疇に属するものとするのである。

Claims (15)

  1. フレーム間予測なしに量子化を行う第1量子化モジュールと、
    フレーム間予測と共に量子化を行う第2量子化モジュールと、を含み、
    前記第1量子化モジュールは、入力信号を量子化する第1量子化部と、第1量子化エラー信号を量子化する第3量子化部と、を含み、
    前記第2量子化モジュールは、予測エラーを量子化する第2量子化部と、第2量子化エラー信号を量子化する第4量子化部と、を含み、
    前記第1量子化部と前記第2量子化部は、トレリス構造のベクトル量子化器である量子化装置。
  2. 前記装置は、オープンループ方式で、予測エラーに基づいて、前記第1量子化モジュールあるいは第2量子化モジュールのうち一つを選択する選択部をさらに含むことを特徴とする請求項1に記載の量子化装置。
  3. 前記第3量子化部と前記第4量子化部は、ベクトル量子化器であることを特徴とする請求項1に記載の量子化装置。
  4. 前記第3量子化部と前記第4量子化部は、コードブックを共有することを特徴とする請求項1に記載の量子化装置。
  5. 前記入力信号の符号化モードがVCモードであることを特徴とする請求項1に記載の量子化装置。
  6. フレーム間予測なしに量子化を行う第1量子化モジュールと、フレーム間予測と共に量子化を行う第2量子化モジュールとのうち一つをオープンループ方式で選択する段階と、
    前記選択された量子化モジュールを使用して入力信号を量子化する段階と、を含み、
    前記第1量子化モジュールは、入力信号を量子化する第1量子化部と、第1量子化エラー信号を量子化する第3量子化部と、を含み、
    前記第2量子化モジュールは、予測エラーを量子化する第2量子化部と、第2量子化エラー信号を量子化する第4量子化部と、を含み、
    前記第3量子化部と前記第4量子化部は、コードブックを共有する量子化方法。
  7. 前記第3量子化部あるいは前記第4量子化部に入力される信号に対して、所定のスケーリングを行うことを特徴とする請求項6に記載の量子化方法。
  8. 前記選択する段階は、予測エラーに基づくことを特徴とする請求項6に記載の量子化方法。
  9. フレーム間予測なしに逆量子化を行う第1逆量子化モジュールと、
    フレーム間予測と共に逆量子化を行う第2逆量子化モジュールと、を含み、
    前記第1逆量子化モジュールは、入力信号を逆量子化する第1逆量子化部と、前記第1逆量子化部と並列に配置される第3逆量子化部と、を含み、
    前記第2逆量子化モジュールは、入力信号を逆量子化する第2逆量子化部と、前記第2逆量子化部と並列に配置される第4逆量子化部と、を含み、
    前記第1逆量子化部と前記第2逆量子化部は、トレリス構造のベクトル逆量子化器の逆量子化装置。
  10. ビットストリームに含まれる量子化スキーム情報に基づいて、前記第1逆量子化モジュールあるいは第2逆量子化モジュールのうち一つを選択する選択部をさらに含むことを特徴とする請求項9に記載の逆量子化装置。
  11. 前記第3逆量子化部と前記第4逆量子化部は、スプリットベクトル逆量子化器であることを特徴とする請求項9に記載の逆量子化装置。
  12. 前記第3逆量子化部と前記第4逆量子化部は、コードブックを共有することを特徴とする請求項9に記載の逆量子化装置。
  13. フレーム間予測なしに逆量子化を行う第1逆量子化モジュールと、フレーム間予測と共に逆量子化を行う第2逆量子化モジュールとのうち一つを選択する段階と、
    前記選択された逆量子化モジュールを使用して入力信号を逆量子化する段階と、を含み、
    前記第1逆量子化モジュールは、入力信号を逆量子化する第1逆量子化部と、前記第1逆量子化部と並列に配置される第3逆量子化部と、を含み、
    前記第2逆量子化モジュールは、入力信号を逆量子化する第2逆量子化部と、前記第2逆量子化部と並列に配置される第4逆量子化部と、を含み、
    前記第3逆量子化部と前記第4逆量子化部は、コードブックを共有する逆量子化方法。
  14. 前記選択する段階は、ビットストリームに含まれたパラメータに基づくことを特徴とする請求項13に記載の逆量子化方法。
  15. 前記第3逆量子化部と前記第4逆量子化部は、スプリットベクトル逆量子化器であることを特徴とする請求項13に記載の逆量子化方法。
JP2016559611A 2014-03-28 2015-03-30 線形予測係数量子化方法及びその装置、並びに線形予測係数逆量子化方法及びその装置 Active JP6542796B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201461971638P 2014-03-28 2014-03-28
US61/971,638 2014-03-28
US201462029687P 2014-07-28 2014-07-28
US62/029,687 2014-07-28
PCT/IB2015/001152 WO2015145266A2 (ko) 2014-03-28 2015-03-30 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2017509926A true JP2017509926A (ja) 2017-04-06
JP6542796B2 JP6542796B2 (ja) 2019-07-10

Family

ID=54196513

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016559611A Active JP6542796B2 (ja) 2014-03-28 2015-03-30 線形予測係数量子化方法及びその装置、並びに線形予測係数逆量子化方法及びその装置

Country Status (8)

Country Link
US (3) US10515646B2 (ja)
EP (2) EP3869506A1 (ja)
JP (1) JP6542796B2 (ja)
KR (3) KR102626320B1 (ja)
CN (2) CN106463134B (ja)
PL (1) PL3125241T3 (ja)
SG (2) SG10201808285UA (ja)
WO (1) WO2015145266A2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2709329T3 (es) * 2014-04-25 2019-04-16 Ntt Docomo Inc Dispositivo de conversión de coeficiente de predicción lineal y procedimiento de conversión de coeficiente de predicción lineal
CN107077857B (zh) 2014-05-07 2021-03-09 三星电子株式会社 对线性预测系数量化的方法和装置及解量化的方法和装置
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
DE102018112215B3 (de) * 2018-04-30 2019-07-25 Basler Ag Quantisiererbestimmung, computerlesbares Medium und Vorrichtung, die mindestens zwei Quantisierer implementiert
US11350093B2 (en) 2018-06-11 2022-05-31 Hanwha Techwin Co., Ltd. Residual coefficient encoding/decoding method and device
KR102030384B1 (ko) 2018-06-19 2019-11-08 광운대학교 산학협력단 잔차 계수 부호화/복호화 방법 및 장치
GB2577698A (en) * 2018-10-02 2020-04-08 Nokia Technologies Oy Selection of quantisation schemes for spatial audio parameter encoding
CN112233682A (zh) * 2019-06-29 2021-01-15 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置
CN110830404A (zh) * 2019-10-31 2020-02-21 西南交通大学 一种基于矢量线性预测的数字移动前传信号量化方法
CN113571073A (zh) * 2020-04-28 2021-10-29 华为技术有限公司 一种线性预测编码参数的编码方法和编码装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004252462A (ja) * 2003-02-19 2004-09-09 Samsung Electronics Co Ltd ブロック制限されたトレリス符号化量子化方法、ならびに音声符号化システムにおいてそのトレリス符号化量子化方法を採用したラインスペクトル周波数係数の量子化方法及び装置
WO2010092827A1 (ja) * 2009-02-13 2010-08-19 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
WO2012144878A2 (en) * 2011-04-21 2012-10-26 Samsung Electronics Co., Ltd. Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5596659A (en) * 1992-09-01 1997-01-21 Apple Computer, Inc. Preprocessing and postprocessing for vector quantization
EP0658263B1 (en) * 1992-09-01 2003-11-05 Apple Computer, Inc. Improved vector quantization
IT1271959B (it) * 1993-03-03 1997-06-10 Alcatel Italia Codec per il parlato a predizione lineare eccitato da un libro di codici
WO1994023426A1 (en) * 1993-03-26 1994-10-13 Motorola Inc. Vector quantizer method and apparatus
JP3557255B2 (ja) 1994-10-18 2004-08-25 松下電器産業株式会社 Lspパラメータ復号化装置及び復号化方法
US5774839A (en) * 1995-09-29 1998-06-30 Rockwell International Corporation Delayed decision switched prediction multi-stage LSF vector quantization
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
JP3246715B2 (ja) 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
US6055496A (en) * 1997-03-19 2000-04-25 Nokia Mobile Phones, Ltd. Vector quantization in celp speech coder
US5974181A (en) * 1997-03-20 1999-10-26 Motorola, Inc. Data compression system, method, and apparatus
TW408298B (en) * 1997-08-28 2000-10-11 Texas Instruments Inc Improved method for switched-predictive quantization
US6125149A (en) * 1997-11-05 2000-09-26 At&T Corp. Successively refinable trellis coded quantization
US6324218B1 (en) * 1998-01-16 2001-11-27 At&T Multiple description trellis coded quantization
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
AU7486200A (en) 1999-09-22 2001-04-24 Conexant Systems, Inc. Multimode speech encoder
US6959274B1 (en) 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6504877B1 (en) * 1999-12-14 2003-01-07 Agere Systems Inc. Successively refinable Trellis-Based Scalar Vector quantizers
JP3404024B2 (ja) 2001-02-27 2003-05-06 三菱電機株式会社 音声符号化方法および音声符号化装置
US7376242B2 (en) * 2001-03-22 2008-05-20 Digimarc Corporation Quantization-based data embedding in mapped data
US8050452B2 (en) * 2001-03-22 2011-11-01 Digimarc Corporation Quantization-based data embedding in mapped data
JP2003140693A (ja) 2001-11-02 2003-05-16 Sony Corp 音声復号装置及び方法
CA2388358A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
WO2005027094A1 (fr) 2003-09-17 2005-03-24 Beijing E-World Technology Co.,Ltd. Procede et dispositif de quantification de vecteur multi-resolution multiple pour codage et decodage audio
KR100659725B1 (ko) * 2005-12-09 2006-12-19 한국전자통신연구원 다중 안테나 시스템의 송신 장치 및 방법과, 수신 장치 및방법
KR100728056B1 (ko) 2006-04-04 2007-06-13 삼성전자주식회사 다중 경로 트랠리스 부호화 양자화 방법 및 이를 이용한다중 경로 트랠리스 부호화 양자화 장치
US20090198491A1 (en) * 2006-05-12 2009-08-06 Panasonic Corporation Lsp vector quantization apparatus, lsp vector inverse-quantization apparatus, and their methods
US8589151B2 (en) * 2006-06-21 2013-11-19 Harris Corporation Vocoder and associated method that transcodes between mixed excitation linear prediction (MELP) vocoders with different speech frame rates
US7414549B1 (en) * 2006-08-04 2008-08-19 The Texas A&M University System Wyner-Ziv coding based on TCQ and LDPC codes
AU2007332508B2 (en) * 2006-12-13 2012-08-16 Iii Holdings 12, Llc Encoding device, decoding device, and method thereof
US8249860B2 (en) * 2006-12-15 2012-08-21 Panasonic Corporation Adaptive sound source vector quantization unit and adaptive sound source vector quantization method
KR100903110B1 (ko) 2007-04-13 2009-06-16 한국전자통신연구원 트렐리스 부호 양자화 알고리듬을 이용한 광대역 음성 부호화기용 lsf 계수 양자화 장치 및 방법
CN101399041A (zh) 2007-09-30 2009-04-01 华为技术有限公司 背景噪声编解码方法及装置
KR101671005B1 (ko) 2007-12-27 2016-11-01 삼성전자주식회사 트렐리스를 이용한 양자화 부호화 및 역양자화 복호화 방법및 장치
CN101609682B (zh) * 2008-06-16 2012-08-08 向为 自适应多速率宽带不连续发送的一种编码器和方法
EP2139000B1 (en) * 2008-06-25 2011-05-25 Thomson Licensing Method and apparatus for encoding or decoding a speech and/or non-speech audio input signal
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
GB2466673B (en) * 2009-01-06 2012-11-07 Skype Quantization
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
US8670990B2 (en) * 2009-08-03 2014-03-11 Broadcom Corporation Dynamic time scale modification for reduced bit rate audio coding
WO2011087333A2 (ko) 2010-01-15 2011-07-21 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US9153238B2 (en) 2010-04-08 2015-10-06 Lg Electronics Inc. Method and apparatus for processing an audio signal
KR101660843B1 (ko) 2010-05-27 2016-09-29 삼성전자주식회사 Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법
FR2961980A1 (fr) * 2010-06-24 2011-12-30 France Telecom Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
MX2013012301A (es) 2011-04-21 2013-12-06 Samsung Electronics Co Ltd Aparato para cuantificar coeficientes de codificacion predictiva lineal, aparato de codificacion de sonido, aparato para decuantificar coeficientes de codificacion predictiva lineal, aparato de decodificacion de sonido y dispositivo electronico para los mismos.
US9406307B2 (en) * 2012-08-19 2016-08-02 The Regents Of The University Of California Method and apparatus for polyphonic audio signal prediction in coding and networking systems
CN103050121A (zh) 2012-12-31 2013-04-17 北京迅光达通信技术有限公司 线性预测语音编码方法及语音合成方法
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
CN103236262B (zh) 2013-05-13 2015-08-26 大连理工大学 一种语音编码器码流的转码方法
CN103632673B (zh) 2013-11-05 2016-05-18 无锡北邮感知技术产业研究院有限公司 一种语音线性预测模型的非线性量化方法
CN107077857B (zh) * 2014-05-07 2021-03-09 三星电子株式会社 对线性预测系数量化的方法和装置及解量化的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004252462A (ja) * 2003-02-19 2004-09-09 Samsung Electronics Co Ltd ブロック制限されたトレリス符号化量子化方法、ならびに音声符号化システムにおいてそのトレリス符号化量子化方法を採用したラインスペクトル周波数係数の量子化方法及び装置
WO2010092827A1 (ja) * 2009-02-13 2010-08-19 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
WO2012144878A2 (en) * 2011-04-21 2012-10-26 Samsung Electronics Co., Ltd. Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BOUZID, MEROUANE: "Robust Quantization of LPC Prameters for Speech Communication Over Noisy Channel", PROC. ICADIWT '09, JPN6017049383, 4 August 2009 (2009-08-04), pages 713 - 718, XP031536971 *

Also Published As

Publication number Publication date
JP6542796B2 (ja) 2019-07-10
KR20240010550A (ko) 2024-01-23
US11848020B2 (en) 2023-12-19
US11450329B2 (en) 2022-09-20
KR20160145561A (ko) 2016-12-20
WO2015145266A3 (ko) 2016-03-10
WO2015145266A2 (ko) 2015-10-01
EP3125241A2 (en) 2017-02-01
EP3869506A1 (en) 2021-08-25
KR20220058657A (ko) 2022-05-09
US20230022496A1 (en) 2023-01-26
US10515646B2 (en) 2019-12-24
CN110853659A (zh) 2020-02-28
CN106463134B (zh) 2019-12-13
SG10201808285UA (en) 2018-10-30
US20200090669A1 (en) 2020-03-19
CN106463134A (zh) 2017-02-22
EP3125241B1 (en) 2021-05-05
US20170178649A1 (en) 2017-06-22
PL3125241T3 (pl) 2021-09-20
CN110853659B (zh) 2024-01-05
SG11201608787UA (en) 2016-12-29
KR102626320B1 (ko) 2024-01-17
KR102392003B1 (ko) 2022-04-28
EP3125241A4 (en) 2017-08-30

Similar Documents

Publication Publication Date Title
US11848020B2 (en) Method and device for quantization of linear prediction coefficient and method and device for inverse quantization
US11922960B2 (en) Method and device for quantizing linear predictive coefficient, and method and device for dequantizing same
KR20180063007A (ko) 선형예측계수 양자화장치, 사운드 부호화장치, 선형예측계수 역양자화장치, 사운드 복호화장치와 전자기기
KR20180063008A (ko) 선형예측계수 양자화방법, 사운드 부호화방법, 선형예측계수 역양자화방법, 사운드 복호화방법, 그 기록매체
US10249308B2 (en) Weight function determination device and method for quantizing linear prediction coding coefficient

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180109

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180409

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190613

R150 Certificate of patent or registration of utility model

Ref document number: 6542796

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250