JP6317387B2 - 加重値関数決定方法 - Google Patents

加重値関数決定方法 Download PDF

Info

Publication number
JP6317387B2
JP6317387B2 JP2016077549A JP2016077549A JP6317387B2 JP 6317387 B2 JP6317387 B2 JP 6317387B2 JP 2016077549 A JP2016077549 A JP 2016077549A JP 2016077549 A JP2016077549 A JP 2016077549A JP 6317387 B2 JP6317387 B2 JP 6317387B2
Authority
JP
Japan
Prior art keywords
coefficient
frequency
lpc
isf
lsf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016077549A
Other languages
English (en)
Other versions
JP2016130868A (ja
Inventor
ソン,ホ−サン
オ,ウン−ミ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2016130868A publication Critical patent/JP2016130868A/ja
Application granted granted Critical
Publication of JP6317387B2 publication Critical patent/JP6317387B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、線形予測符号化(LPC:linear predictive coding)係数を量子化するための加重値関数を決定する装置及びその方法に係り、さらに具体的には、線形予測(LP:linear prediction)技術で、線形予測符号化係数の量子化効率を向上させるために、低複雑度を有する加重値関数を決定する装置及びその方法に関する。
従来、音声信号及びオーディオ信号を符号化するために、線形予測符号化が適用された。線形予測のために、CELP(code excited linear prediction)符号化技術が使用されたが、CELP符号化技術は、入力信号に係わる線形予測符号化係数と、励起信号(excited signal)とを必要とする。入力信号を符号化するとき、LPC係数は量子化される。しかし、LPC係数をそれ自体で量子化することは、ダイナミックレンジが狭く、安定度確認が困難であるという問題点がある。
また、復号化段階で、入力信号を復元するためのコードブック・インデックスを選択しなければならないが、全てのLPC係数を同一の重要度にして量子化する場合、最終合成された入力信号の品質の劣化が発生することがある。すなわち、全てのLPC係数は重要度が異なるので、重要なLPC係数のエラーが小さくてこそ、最終合成された入力信号の品質が向上するが、かような重要度が異なるという点を考慮せずに、同一の重要度を適用して量子化すれば、入力信号の品質は落ちてしまう。
従って、LPC係数を効率的に量子化し、復号化器を介して入力信号を復元するとき、合成信号の品質を向上させる方法が要求される。何よりも類似した複雑度で優秀なコーディング性能を示す技術が必要である。
本発明の一実施形態による装置は、入力信号の中間サブフレーム(mid-subframe)の線形予測符号化(LPC)係数を線スペクトル周波数(LSF:line spectral frequency)係数またはイミッタンススペクトル周波数(ISF:immittance spectral frequency)係数のうちいずれか一つに変換する第1係数変換部と、前記変換されたISF係数またはLSF係数を利用して、前記中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する加重値関数決定部と、前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する量子化部と、少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する第2係数変換部と、を含み、前記量子化されたLPC係数は前記装置のエンコーダに出力されもする。
本発明の一実施形態による方法は、入力信号の中間サブフレームの線形予測符号化(LPC)係数を線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数のうちいずれか一つに変換する段階と、前記変換されたISF係数またはLSF係数を利用して、前記中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する段階と、前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する段階と、少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する段階と、を含み、前記量子化されたLPC係数は、エンコーダに出力されもする。
本発明の一実施形態による装置は、線形予測符号化(LPC)係数に対応する線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数を利用して、入力信号の中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する加重値関数決定部と、前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する量子化部と、少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する第2係数変換部と、を含み、前記量子化されたLPC係数は、前記装置のエンコーダに出力されもする。
本発明の一実施形態による方法は、線形予測符号化(LPC)係数に対応する線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数を利用して、入力信号の中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する段階と、前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する段階と、少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する段階と、を含み、前記量子化されたLPC係数は、エンコーダに出力されもする。
本発明の一実施形態によれば、前記方法を遂行するためのプログラムが記録されていることを特徴とするコンピュータで読み取り可能な命令語が記録されていることを特徴とするコンピュータで読み取り可能な記録媒体が提供される。
本発明の一実施形態によるオーディオ信号符号化装置の全体構成を図示した図面である。 本発明の一実施形態による図1のLPC係数量子化部の詳細構成を図示した図面である。 本発明の一実施形態によるLPC係数を量子化する過程を図示した図面である。 本発明の一実施形態によるLPC係数を量子化する過程を図示した図面である。 本発明の一実施形態によるLPC係数を量子化する過程を図示した図面である。 本発明の一実施形態によって、図2の加重値関数決定部が加重値関数を決定する過程を図示した図面である。 本発明の一実施形態による符号化モード、入力信号の帯域幅情報を利用して、加重値関数を決定する過程を図示した図面である。 本発明の一実施形態によって、LPC係数を変換したISFを図示した図面である。 本発明の一実施形態によって、符号化モードによる加重値関数を図示した図面である。 本発明の一実施形態によって、符号化モードによる加重値関数を図示した図面である。 本発明の他の一実施形態によって、図2の加重値関数決定部が加重値関数を決定する過程を図示した図面である。 本発明の一実施形態によって、中間サブフレームのLPC符号化方式を説明するための図面である。
本発明の一実施形態による装置は、入力信号の中間サブフレーム(mid-subframe)の線形予測符号化(LPC:linear predictive coding)係数を線スペクトル周波数(LSF:line spectral frequency)係数またはイミッタンススペクトル周波数(ISF:immittance spectral frequency:ISF)係数のうちいずれか一つに変換する第1係数変換部と、前記変換されたISF係数またはLSF係数を利用して、前記中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する加重値関数決定部と、前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する量子化部と、少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する第2係数変換部と、を含み、前記量子化されたLPC係数は、前記装置のエンコーダに出力されもする。
本発明の一実施形態による装置の加重値関数決定部は、前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応する補間されたスペクトルサイズ(interpolated spectrum magnitude)を利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することができる。
本発明の一実施形態による装置の加重値関数決定部は、前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応するLPCスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することができる。
本発明の一実施形態による方法は、入力信号の中間サブフレームの線形予測符号化(LPC)係数を、線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数のうちいずれか一つに変換する段階と、前記変換されたISF係数またはLSF係数を利用して、前記中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する段階と、前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する段階と、少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する段階と、を含み、前記量子化されたLPC係数は、エンコーダに出力されもする。
本発明の一実施形態による方法で、加重値関数を決定する段階は、前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応する補間されたスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することができる。
本発明の一実施形態による方法で加重値関数を決定する段階は、前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応するLPCスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することができる。
本発明の一実施形態によれば、LPC係数をISF係数またはLSF係数に変換して量子化することにより、LPC係数の量子化効率を向上させることができる。本発明の一実施形態によれば、LPC係数の重要度と係わる加重値関数を決定することにより、LPC係数の重要度による合成信号の品質を向上させることができる。
本発明の一実施形態によれば、中間サブフレームのLPC係数を量子化するために、現在フレームのLPC係数を量子化するための加重値関数と、以前フレームのLPC係数を量子化するための加重値関数とを補間することにより、入力信号の品質を向上させることができる。
本発明の一実施形態によれば、ISFまたはLSFが、実際に入力信号のスペクトル包絡線に影響を及ぼすことを示すサイズ別加重値関数だけではなく、周波数ドメインでの知覚的な特性と、フォルマント(formant)の分布とを考慮した周波数別加重値関数を組み合わせることにより、LPC係数の量子化効率を向上させることができ、LPC係数に係わる加重値が正確に導き出される。
本発明の一実施形態による装置は、線形予測符号化(LPC)係数に対応する線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数を利用して、入力信号の中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する加重値関数決定部と、前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する量子化部と、少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する第2係数変換部と、を含み、前記量子化されたLPC係数は、前記装置のエンコーダに出力されてもよい。
本発明の一実施形態による方法は、線形予測符号化(LPC)係数に対応する線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数を利用して、入力信号の中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する段階と、前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する段階と、少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する段階と、を含み、前記量子化されたLPC係数は、エンコーダに出力されてもよい。
本発明の一実施形態によれば、実施形態の方法を遂行するためのプログラムが記録されていることを特徴とするコンピュータで読み取り可能な記録媒体を提供することができる。
以下、添付された図面に記載した内容を参照して、本発明による実施形態について詳細に説明する。ただし、本発明が実施形態によって制限されたり、あるいは限定されるものではない。各図面に提示された同一の参照符号は、同一の部材を示す。
図1は、本発明の一実施形態によるオーディオ信号符号化装置の全体構成を図示した図面である。図1を参照すれば、本発明の一実施形態によるオーディオ信号符号化装置100は、前処理部101、スペクトル分析部102、LPC係数抽出部及びオープンループピッチ分析部103、符号化モード選択部104、LPC係数量子化部105、符号化部106、エラー復元部107及びビットストリーム生成部108を含む。このとき、オーディオ信号符号化装置100は、スピーチ(speech)信号に適用されてもよい。
前処理部101は、入力信号を前処理(pre-processing)することができる。これを介して、入力信号は、符号化のための準備が完了する。具体的には、前処理部101は、ハイパスフィルタ(high pass filtering)、プリエンファシス(pre-emphasis)及びサンプリング(sampling)変換の過程を介して、入力信号を前処理することができる。
スペクトル分析部102は、時間−周波数マッピング(time-to-frequency mapping)過程を介して、入力信号に係わる周波数ドメインの特性を分析することができる。そして、スペクトル分析部102は、音声活動度探索(voice activity detection)過程を介して、入力信号が、活性信号(active signal)であるか、あるいは黙音(mute)であるかを決定することができる。また、スペクトル分析部102は、入力信号で背景ノイズを除去することができる。
LPC係数抽出部及びオープンループピッチ分析部103は、入力信号の線形予測(LP)分析を介して、線形予測符号化係数(LPC係数)を抽出することができる。一般的に、フレーム当たり1回の線形予測分析が実行されるが、追加的な音質向上のために、2回以上の線形予測分析が実行されてもよい。この場合、1回は、既存の線形予測分析であるフレームエンド(frame-end)のための線形予測であり、残りは、音質向上のための中間サブフレーム(mid-subframe)のための線形予測が追加される。このとき、現在フレームのフレームエンドは、現在フレームを構成するサブフレームのうち最後のサブフレームを意味し、以前フレームのフレームエンドは、以前フレームを構成するサブフレームのうち最後のサブフレームを意味する。
ここで、中間サブフレームは、以前フレームのフレームエンドである最後のサブフレームと、現在フレームのフレームエンドである最後のサブフレームとの間に存在するサブフレームのうち一つ以上のサブフレームを意味する。それにより、LPC係数抽出部及びオープンループピッチ分析部103は、全2セット以上のLPC係数を抽出することができる。
そして、LPC係数抽出部及びオープンループピッチ分析部103は、オープンループ(open-loop)を介して、入力信号のピッチ(pitch)を分析することができる。このとき、分析されたピッチ情報は、適応的なコードブック(adaptive codebook)探索に使用される。
符号化モード選択部104は、ピッチ情報、周波数ドメインの分析情報などを利用して、入力信号の符号化モード(coding mode)を選択することができる。一例として、入力信号は、generic mode、voiced mode、unvoiced modeまたはtransition modeに分類された符号化モードによって符号化される。
LPC係数量子化部105は、LPC係数抽出部及びオープンループピッチ分析部103で抽出されたLPC係数を量子化することができる。LPC係数量子化部105については、図2ないし図9を介して具体的に説明する。
符号化部106は、選択された符号化モードによって、LPC係数の励起(excitation)信号を符号化する。LPC係数の励起信号を符号化するための代表的なパラメータは、adaptive codebook index、adaptive codebook gain、fixed codebook index、fixed codebook gainなどがある。このとき、符号化部106は、LPC係数の励起信号をサブフレームの単位で符号化することができる。
エラー復元部107は、入力信号のフレームでエラーが発生したとき、フレームを復元したり、あるいは隠匿して、全体的な音質向上のための付加情報(side information)を抽出することができる。
ビットストリーム生成部108は、符号化された信号をビットストリームに生成することができる。このとき、ビットストリームは、保存や伝送の目的に使用される。
図2は、本発明の一実施形態による図1のLPC係数量子化部の詳細構成を図示した図面である。図2を参照すれば、2段階の量子化過程が遂行される。最初の段階は、LPC係数量子化部200が、現在フレームまたは以前フレームのフレームエンドのための線形予測に係わり、第2の段階は、音質向上のために、中間サブフレームのための線形予測を行うのである。
現在フレームまたは以前フレームのフレームエンドに係わるLPC係数量子化部200は、第1係数変換部202、加重値関数決定部203、量子化部204及び第2係数変換部205を含むことができる。
第1係数変換部202は、入力信号の現在フレームまたは以前フレームのフレームエンドを線形予測分析して抽出された線形予測符号化(LPC)係数を変換することができる。一例として、第1係数変換部202は、現在フレームまたは以前フレームのフレームエンドに係わるLPC係数を、線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数のうちいずれか1つのフォーマットに変換することができる。このとき、ISF係数やLSF係数は、LPC係数をより容易に量子化することができるフォーマットを示す。
加重値関数決定部203は、LPC係数から変換されたISF係数またはLSF係数を利用して、前記現在フレームのフレームエンド及び以前フレームのフレームエンドに係わるLPC係数の重要度と係わる加重値関数(weighting function)を決定することができる。一例として、加重値関数決定部203は、サイズ別加重値関数と周波数別加重値関数とを決定することができる。そして、加重値関数決定部203は、周波数帯域、符号化モード及びスペクトル分析情報のうち少なくとも一つを考慮して、加重値関数を決定することができる。
一例として、加重値関数決定部203は、符号化モード別に最適の加重値関数を導き出すことができる。そして、加重値関数決定部203は、入力信号の周波数帯域によって、最適の加重値関数を導き出すことができる。また、加重値関数決定部203は、入力信号の周波数分析情報によって、最適の加重値関数を導き出すことができる。このとき、周波数分析情報は、スペクトルチルト情報を含んでもよい。
さて、加重値関数決定部203を介して導き出された現在フレームのフレームエンドのLPC係数を量子化するための加重値関数、及び以前フレームのフレームエンドのLPC係数を量子化するための加重値関数は、中間サブフレームのLPC係数を量子化するための加重値関数を決定するために、加重値関数決定部207に伝達される。
加重値関数決定部203の動作については、図4及び図8でさらに具体的に説明する。
量子化部204は、現在フレームのフレームエンド、または以前フレームのフレームエンドのLPC係数が変換されたISF係数またはLSF係数に係わる加重値関数を利用して、変換されたISF係数またはLSF係数を量子化することができる。量子化の結果、現在フレームまたは以前フレームのフレームエンドに係わる量子化されたISF係数またはLSF係数のインデックスが導き出される。
そして、第2係数変換部205は、量子化されたISF係数(QISF)または量子化されたLSF係数(QLSF)を、量子化されたLPC係数(QLPC)に変換することができる。第2係数変換部205を介して導き出された量子化されたLPC係数は、単純なスペクトル情報を示すのではなく、反映係数(reflection coefficient)を示すので、固定された加重値が使用される。
図2を参照すれば、中間サブフレームに係わるLPC係数量子化部201は、第1係数変換部206、加重値関数決定部207、量子化部208及び第2係数変換部209を含んでもよい。
第1係数変換部206は、中間サブフレームのLPC係数を、ISF係数またはLSF係数のうちいずれか一つに変換することができる。
加重値関数決定部207は、変換されたISF係数またはLSF係数を利用して、中間サブフレームのLPC係数の重要度と係わる加重値関数を決定することができる。
一例として、加重値関数決定部207は、現在フレームのパラメータと、以前フレームのパラメータとを補間(interpolation)し、前記中間サブフレームのLPC係数を量子化するための加重値関数を決定することができる。具体的には、加重値関数決定部207は、以前フレームのフレームエンドのLPC係数を量子化するための第1加重値関数と、現在フレームのフレームエンドのLPC係数を量子化するための第2加重値関数とを補間し、中間サブフレームのLPC係数を量子化するための加重値関数を決定することができる。
このとき、加重値関数決定部207は、線形補間(linear-interpolation)及び非線形補間(non-linear interpolation)のうち少なくとも一つを利用して補間を行うことができる。具体的には、加重値関数決定部207は、(1)線形補間及び非線形補間を全ての寸法のベクトルに適用する方式、(2)サブベクトルごとに、線形補間と非線形補間とを異ならせて適用する方式、(3)それぞれのLPC係数によって、線形補間と非線形補間を異ならせて適用する方式のうちいずれか一つを遂行することができる。
そして、加重値関数決定部207は、現在フレームのフレームエンドに係わる第1加重値関数と、以前フレームのフレームエンドに係わる第2加重値関数との全体を利用して補間することもできるが、加重値関数を導き出す数式を分析し、一部の構成要素(component)を利用して補間することもできる。例えば、加重値関数決定部207は、サイズ別加重値関数を決定するのに使用されるスペクトル情報を、補間を介して求めることができる。
一例として、加重値関数決定部207は、LPC係数から変換されたISF係数またはLSF係数の周波数に対応する補間されたスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することができる。このとき、補間されたスペクトルサイズは、現在フレームのフレームエンドのスペクトルサイズと、以前フレームのフレームエンドのスペクトルサイズとが補間された結果であることを意味する。具体的には、加重値関数決定部207は、LPC係数から変換されたISF係数またはLSF係数の周波数と、周辺周波数に対応するスペクトルサイズとを利用して、中間サブフレームのISF係数またはLSF係数に係わる加重値関数を決定することができる。このとき、加重値関数決定部207は、LPC係数から変換されたISF係数またはLSF係数の周波数と周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して加重値関数を決定することができる。
補間されたスペクトルサイズを利用して、加重値関数を決定する過程については、図5で具体的に説明する。
他の一例として、加重値関数決定部207は、LPC係数から変換されたISF係数またはLSF係数の周波数に対応するLPCスペクトルサイズを利用して、ISF係数またはLSF係数に係わる加重値関数を決定することができる。このとき、LPCスペクトルサイズは、中間サブフレームのLPC係数を周波数変換したLPCスペクトルに基づいて決定される。具体的には、加重値関数決定部207は、LPC係数から変換されたISF係数またはLSF係数の周波数と周辺周波数とに対応するスペクトルサイズを利用して、ISF係数またはLSF係数に係わる加重値関数を決定することができる。このとき、加重値関数決定部207は、LPC係数から変換されたISF係数またはLSF係数の周波数と周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して、加重値関数を決定することができる。
LPCスペクトルサイズを利用して、中間サブフレームに係わる加重値関数を決定する過程は、図8で具体的に説明する。
そして、加重値関数決定部207は、中間サブフレームの周波数帯域、符号化モード情報または周波数分析情報のうち少なくとも一つに基づいて、加重値関数を決定することができる。このとき、周波数分析情報は、スペクトルチルト情報を含んでもよい。
また、加重値関数決定部207は、LPCスペクトルサイズまたは補間されたスペクトルサイズのうち少なくとも一つに基づいて、決定されたサイズ別加重値関数と、周波数別加重値関数とを組み合わせ、最終的な加重値関数を決定することができる。このとき、周波数別加重値関数は、中間サブフレームのLPC係数から変換されたISF係数またはLSF係数の周波数に対応する加重値関数であり、バークスケール(bark scale)で表現されてもよい。
量子化部208は、中間サブフレームのLPC係数が変換されたISF係数またはLSF係数に係わる加重値関数を利用して、変換されたISF係数またはLSF係数を量子化することができる。量子化の結果、中間サブフレームに係わる量子化されたISF係数またはLSF係数のインデックスが導き出される。
そして、第2係数変換部209は、量子化されたISF係数(QISF)または量子化されたLSF係数(QLSF)を、量子化されたLPC係数(QLPC)に変換することができる。第2係数変換部205を介して導き出された量子化されたLPC係数は、単純なスペクトル情報を示すものではなく、反映係数を示すので、固定された加重値が使用される。
以下では、LPC係数と加重値関数との関係について具体的に説明する。
音声(speech)信号及びオーディオ信号を時間ドメインで符号化するとき、使用可能な技術のうち一つとして、線形予測(LPC)がある。線形予測技術は、短区間予測(short-term prediction)を意味する。このとき、線形予測の結果は、時間ドメインでは、隣接したサンプル間の相関度(correlation)で示し、周波数ドメインでは、スペクトル包絡線で示す。
線形予測技術を応用した符号化技術として、CELP(code excited linear prediction)技術がある。CELP技術を使用する音声符号化技術は、G.729、AMR(adaptive multi-rate)、AMR−WB(wideband)、EVRC(enhanced variable rate codec)などがある。CELP技術を利用して、音声及びオーディオ信号を符号化するために、LPC係数と励起信号とが必要である。
LPC係数は、隣接したサンプル間の相関度を示し、スペクトルピークで表現される。もしLPC係数の次数が16次である場合、最大16個のサンプル間の相関度が導き出される。LPC係数の次数は、入力信号の帯域幅によって決定され、一般的に、音声信号の特性によって決定される。このとき、音声信号の主な発声は、フォルマント(formant)の大きさ及び位置によって決定される。入力信号のフォルマントを表現するために、狭帯域(NB:narrow band:NB)である300〜3,400Hz区間の入力信号については、10次のLPC係数が使用される。そして、広帯域(WB:wide band)である50〜7,000Hz区間の入力信号については、16〜20次のLPC係数が使用される。
下記数式(1)は、合成フィルタH(z)を示すものであり、aは、LPC係数を意味し、pは、LPC係数の次数を意味する。
Figure 0006317387
下記数式(2)は、復号化器で合成された合成信号を意味する。
Figure 0006317387
このとき、
Figure 0006317387
は、合成信号を意味し、
Figure 0006317387
は、励起信号を意味する。そして、Nは、同一の係数を利用する符号化フレームの大きさを意味する。このとき、励起信号は、adaptive codebookとfixed codebookとの和として決定される。復号化装置では、復号化された励起信号と量子化されたLPC係数とを利用して、合成信号を作る。
LPC係数は、スペクトルピーク(spectrum peak)として現れるスペクトルのフォルマント情報を表現し、全体スペクトルの包絡線(envelope)を符号化することに使用される。このとき、符号化装置は、LPC係数の量子化効率を高めるために、LPC係数を、ISFまたはLSFに変換することができる。
ISFは、簡単な安定度確認を介して、量子化による発散を防止することができる。もし安定度に問題が発生する場合、量子化されたISFの間隔を調節することにより、安定度の問題が解決されてもよい。そして、LSFは、ISFと違い最後の係数が反映係数である点で違いがあるのみ、残りの特性は同一である。ここで、ISFまたはLSFは、LPC係数から変換された係数であるので、LPC係数のスペクトルのフォルマント情報を同一に維持している。
具体的には、LPC係数の量子化は、LPC係数を、ダイナミックレンジ(dynamic range)が狭く、安定度(stability)確認が容易であり、補間に有利なISPやLSPに変換した後で遂行されてもよい。ISP(immittance spectral pair)やLSP(line spectral pair)は、ISFやLSFで表現されてもよい。下記数式(3)は、ISFとISPとの関係、またはLSFとLSPとの関係を意味する。
Figure 0006317387
ここで、qは、LSPまたはISPであり、ωは、LSFまたはISFを意味する。LSFは、量子化効率のために、ベクトル量子化されてもよい。効率を向上させるために、LSFは、予測ベクトル量子化されてもよい。ベクトル量子化を行う場合、dimensionが高くなれば、ビット効率が向上するが、コードブック・サイズが大きくなり、処理速度が落ちることがある。そのために、マルチステージ・ベクトル量子化(multi-stage vector quantization)を行ったり、スプリットベクトル量子化(split vector quantization)を介して、コードブックのサイズが小さくなる。
ベクトル量子化は、ベクトル内のエントリ(entry)いずれも同一の重要度であると見なし、squared error distance measureを利用して、最も少ないエラーを有するコードブック・インデックスを選択する過程を意味する。しかし、LPC係数において、全ての係数の重要度が異なるので、重要な係数のエラーを減少させ、最終合成された信号の知覚的な品質(perceptual quality)が向上するのである。従って、LSF係数を量子化するとき、復号化装置は、各LPC係数の重要度を表現する加重値関数(weighting function)をsquared error distance measureに適用し、最適のコードブック・インデックスを選択することにより、合成信号の性能を向上させることができる。
本発明の一実施形態によれば、ISFやLSFの周波数情報と、実際のスペクトルサイズとを利用して、各ISFまたは各LSFが、実際にスペクトル包絡線にいかなる影響を与えるかに係わるサイズ別加重値関数を決定することができる。そして、本発明の一実施形態によれば、周波数ドメインの知覚的な特性及びフォルマントの分布を考慮した周波数別加重値関数を、サイズ別加重値関数と組み合わせ、追加的な量子化効率を得ることができる。また、本発明の一実施形態によれば、実際周波数ドメインの大きさを使用するので、全体周波数の包絡線情報が好ましく反映され、各ISF係数または各LSF係数の加重値を正確に導き出すことができる。
結局、本発明の一実施形態によれば、LPC係数を変換したISFまたはLSFをベクトル量子化するとき、各係数の重要度が異なる場合、ベクトル内で、いかなるエントリが相対的にさらに重要であるかを示す加重値関数を決定することができる。そして、符号化しようとするフレームのスペクトルを分析し、エネルギーが大きい部分にさらに大きい加重値を与えることができる加重値関数を決定することにより、符号化の正確度を向上させることができる。スペクトルのエネルギーが大きいということは、時間ドメインで、相関度が高いということを意味する。
図3A、図3B、図3Cは、本発明の一実施形態によるLPC係数を量子化する過程を図示した図面である。
図3A、図3B、図3Cを参照すれば、2種形態のLPC係数を量子化する過程が図示されている。図3Aは、入力信号の変動性が大きい場合に適用され、図3Bは、入力信号の変動性が小さい場合に適用される。入力信号の特性によって、図3Aと図3Bは、スイッチングされて適用されてもよい。そして、図3A、図3B、図3Cは、中間サブフレームのLPC係数を量子化する過程を示す。
LPC係数量子化部301は、SQ(scalar quantization)、VQ(vector quantization)、SVQ(split-vector quantization)、MSVQ(multi-stage vector quantization)を介して、ISFを量子化することができる。LSFも同一に適用されてもよい。
予測部302は、AR(auto regressive)予測やMA(moving average)予測を行うことができる。このとき、予測次数は、1以上の定数を意味する。
下記数式(4)は、図3Aを介して量子化されたISFを介して、コードブック・インデックスを探索するためのエラー関数を意味する。そして、下記数式(5)は、図3Bを介して量子化されたISFを介して、コードブック・インデックスを探索するためのエラー関数を意味する。コードブック・インデックスは、エラー関数を最小化する値を意味する。
また、下記数式(6)は、図3Cで、ITU−T(International Telecommunication Union-Telecommunication sector) G.718で使用される中間サブフレームの量子化を介して導き出されたエラー関数を意味する。数式(6)を参考にすれば、現在フレームのフレームエンドについて量子化されたISF値
Figure 0006317387
と、以前フレームのフレームエンドについて量子化されたISF値
Figure 0006317387
を利用し、中間サブフレームの量子化の結果に係わるエラーを最小化するinterpolation weight setのインデックスが導き出される。
Figure 0006317387
ここで、w(n)は、加重値関数を意味し、z(n)は、図3で、ISF(n)からmean値を除外したベクトルである。c(n)は、コードブックを示す。pは、ISF係数の次数を意味し、NB(narrow band)では、通常10、WB(wide band)では、通常16〜20を使用する。
本発明の一実施形態によれば、符号化装置は、LPC係数から変換されたISF係数またはLSF係数の周波数にあたるスペクトルサイズ(spectrum magnitude)を利用したサイズ別加重値関数と、入力信号の知覚的な特性及びフォルマント分布を考慮した周波数別加重値関数とを組み合わせ、最適の加重値関数を決定することができる。
図4は、本発明の一実施形態によって、図2の加重値関数決定部が加重値関数を決定する過程を図示した図面である。図4を参照すれば、スペクトル分析部102の詳細構成が図示されている。スペクトル分析部102は、補間部401及びサイズ計算部402を含んでもよい。
補間部401は、スペクトル分析部102の遂行結果である現在フレームのフレームエンドに係わるスペクトルサイズと、以前フレームのフレームエンドに係わるスペクトルサイズとを補間し、中間サブフレームの補間されたスペクトルサイズを導き出すことができる。このとき、中間サブフレームの補間されたスペクトルサイズは、線形補間または非線形補間を介して導き出される。
サイズ計算部402は、中間サブフレームの補間されたスペクトルサイズを利用して、周波数スペクトルビン(bin)のサイズを計算することができる。周波数スペクトルビンの個数は、加重値関数決定部207が、ISF係数またはLSF係数を正規化するために設定した範囲に対応する周波数スペクトルビンの個数と同一に決定される。
それにより、サイズ計算部402を介して導き出されたスペクトル分析情報である周波数スペクトルビンのサイズは、加重値関数決定部207がサイズ別加重値関数を決定するときに活用されてもよい。
この後、加重値関数決定部207は、中間サブフレームのLPC係数が、変換されたISFまたはLSFを正規化することができる。本過程で、ISF係数の最後の係数は、反映係数であるので、同一のweightが適用されてもよい。LSFは、かような方式が適用されない。p次数のISFのうち、実際に本過程が適用される範囲は、0〜(p−2)までである。通常0〜(p−2)までのISFは、0〜πに存在する。加重値関数決定部207は、スペクトル分析情報を利用するために、サイズ計算部402を介して導き出された周波数スペクトルビンの個数と同一の個数Kで正規化を行うことができる。
その後、加重値関数決定部207は、サイズ計算部402を介して伝達したスペクトル分析情報を利用して、中間サブフレームについて、ISF係数またはLSF係数がスペクトル包絡線に影響を及ぼすサイズ別加重値関数W(n)を決定することができる。一例として、加重値関数決定部207は、ISF係数またはLSF係数の周波数情報と、入力信号の実際スペクトルサイズとを利用して、サイズ別加重値関数を決定することができる。このとき、サイズ別加重値関数は、LPC係数から変換されたISF係数またはLSF係数のために決定される。
そして、加重値関数決定部207は、ISF係数またはLSF係数の周波数それぞれに対応する周波数スペクトルビンのサイズを利用して、サイズ別加重値関数を決定することができる。
または、加重値関数決定部207は、ISF係数またはLSF係数の周波数それぞれに対応するスペクトルビン、及びスペクトルビンの周辺に位置した少なくとも1つの周辺スペクトルビンのサイズを利用して、サイズ別加重値関数を決定することができる。このとき、加重値関数決定部207は、スペクトルビン、及び少なくとも1つの周辺スペクトルビンの代表値を抽出し、スペクトル包絡線と係わるサイズ別加重値関数を決定することができる。このとき、代表値の例は、ISF係数またはLSF係数の周波数それぞれに対応するスペクトルビン、及び前記スペクトルビンに係わる少なくとも1つの周辺スペクトルビンの最大値、平均値または中間値であってもよい。
一例として、加重値関数決定部207は、ISF係数またはLSF係数の周波数情報を利用して、周波数別加重値関数W(n)を決定することができる。具体的には、加重値関数決定部207は、入力信号の知覚的な特性及びフォルマント分布を利用して、周波数別加重値関数を決定することができる。このとき、加重値関数決定部207は、バークスケールによって、入力信号の知覚的な特性を抽出することができる。そして、加重値関数決定部207は、フォルマントの分布のうち、最初のフォルマントに基づいて、周波数別加重値関数を決定することができる。
一例として、周波数別加重値関数の場合、低周波及び高周波で、相対的に低い加重値を示し、低周波で、一定周波数区間内(first formantに該当する区間)で、同一サイズの加重値を示すことができる。
その後、加重値関数決定部207は、サイズ別加重値関数と、周波数別加重値関数とを組み合わせ、最終的な加重値関数を決定することができる。このとき、加重値関数決定部207は、サイズ別加重値関数と、周波数別加重値関数とを乗じたり加え、最終的な加重値関数を決定することができる。
他の一例として、加重値関数決定部207は、入力信号の符号化モード及び周波数帯域情報を考慮し、サイズ別加重値関数と、周波数別加重値関数とを決定することができる。これについては、図5で具体的に説明する。
図5は、本発明の一実施形態による符号化モード、入力信号の帯域幅情報を利用して、加重値関数を決定する過程を図示した図面である。
加重値関数決定部207は、入力信号の帯域幅を確認することができる(S501)。それにより、加重値関数決定部207は、入力信号の帯域幅が広帯域(WB)に属するか否かを判断することができる(S502)。このとき、入力信号の帯域幅が広帯域ではない場合、加重値関数決定部270は、入力信号の帯域幅が狭帯域(NB)に属するか否かを判断することができる。もし入力信号の帯域幅が狭帯域に属さない場合、加重値関数決定部207は、加重値関数を決定しない。そして、入力信号の帯域幅が狭帯域に属する場合、加重値関数決定部207は、段階S503から段階S510までの過程を介して、帯域幅に基づいて、当該サブブロック(中間サブフレーム)を処理することができる。
そして、入力信号の帯域幅が広帯域である場合、加重値関数決定部207は、入力信号の符号化モードを確認することができる(S503)。その後、加重値関数決定部207は、入力信号の符号化モードが無声音モード(unvoiced)であるか否かを判断することができる(S504)。入力信号の符号化モードが無声音モードである場合、加重値関数決定部207は、無声音モードについて、サイズ別加重値関数を決定し(S505)、無声音モードについて、周波数別加重値関数を決定し(S506)、サイズ別加重値関数と、周波数別加重値関数とを組み合わせることができる(S507)。
一方、入力信号の符号化モードが無声音モードではない場合、加重値関数決定部207は、有声音モードについて、サイズ別加重値関数を決定し(S508)、有声音モードについて、周波数別加重値関数を決定し(S509)、サイズ別加重値関数と、周波数別加重値関数とを組み合わせることができる(S510)。もし入力信号の符号化モードがgeneric modeまたはtransition modeである場合、加重値関数決定部207は、有声音モードと同一の過程を介して、加重値関数を決定することができる。
一例として、入力信号をFFT(fast Fourier transform)方式によって周波数変換したとき、FFT係数のスペクトルサイズを利用したサイズ別加重値関数は、数式(7)によって決定される。
Figure 0006317387
図6は、本発明の一実施形態によって、LPC係数を変換したISFを図示した図面である。
具体的には、図6は、入力信号を、FFTを介して周波数ドメインに変換したときのスペクトル結果、スペクトルで導き出されたLPC係数、及びLPC係数を変換したISFを図示している。入力信号にFFTを適用した結果が256個のサンプルである場合、16次線形予測を行えb、16個のLPC係数が導き出され、16個のLPC係数は、16個のISF係数に変換されてもよい。
図7A及び図7Bは、本発明の一実施形態によって、符号化モードによる加重値関数を図示した図面である。
具体的には、図7A及び図7Bは、図5で、符号化モードによって決定された周波数別加重値関数を示している。グラフ701は、有声音モードでの周波数別加重値関数を示す。そして、グラフ702は、無声音モードでの周波数別加重値関数を示す。
一例として、グラフ701は、下記数式(8)によって決定され、グラフ702は、下記数式(9)によって決定される。数式(8)及び数式(9)での定数は、入力信号の特性によって変更されてもよい。
Figure 0006317387
サイズ別加重値関数と、周波数別加重値関数とを組み合わせ、最終的に導き出される加重値関数は、下記数式(10)によって決定される。
Figure 0006317387
図8は、本発明の他の一実施形態によって、図2の加重値関数決定部が加重値関数を決定する過程を図示した図面である。図8を参照すれば、スペクトル分析部102の詳細構成が図示される。スペクトル分析部102は、周波数マッピング部801及びサイズ計算部802を含んでもよい。
周波数マッピング部801は、中間サブフレームのLPC係数を、周波数ドメイン信号にマッピングさせることができる。一例として、周波数マッピング部801は、中間サブフレームのLPC係数をFFT、またはMDCT(modified discrete cosine transform)などを介して周波数変換し、中間サブフレームに係わるLPCスペクトル情報を決定することができる。このとき、周波数マッピング部801が256pointの代わりに、64pointのFFTを利用すれば、非常に低い複雑度で周波数変換される。周波数マッピング部801は、LPCスペクトル情報を利用して、中間サブフレームに係わる周波数スペクトルサイズを決定することができる。
サイズ計算部802は、中間サブフレームの周波数スペクトルサイズを利用して、周波数スペクトルビンのサイズを計算することができる。周波数スペクトルビンの個数は、加重値関数決定部207が、ISF係数またはLSF係数を正規化するために設定した範囲に対応する周波数スペクトルビンの個数と同一に決定される。
それにより、サイズ計算部802を介して導き出されたスペクトル分析情報である周波数スペクトルビンのサイズは、加重値関数決定部207がサイズ別加重値関数を決定するときに活用される。
その後、加重値関数決定部207が加重値関数を決定する過程は、図5ですでに具体的に説明したが、図8ではそれに係わる説明を省略する。
図9は、本発明の一実施形態によって、中間サブフレームのLPC符号化方式について説明するための図面である。
CELP符号化技術は、入力信号に係わるLPC係数と励起信号とを必要とする。入力信号を符号化するとき、LPC係数が量子化されてもよい。しかし、LPC係数をそれ自体で量子化することは、ダイナミックレンジが広く、安定度確認が困難であるという問題点があるから、ダイナミックレンジが狭く、安定度確認が容易であるLSF(またはLSP)やISF(ISP)に変換されて符号化されてもよい。
このとき、ISF係数やLSF係数に変換されたLPC係数は、一般的に量子化の効率のためにベクトル量子化される。この過程で、全てのLPC係数を同一の重要度にして量子化する場合、最終合成された入力信号の品質の劣化が発生することがある。すなわち、全てのLPC係数は、重要度が異なるので、重要なLPC係数のエラーが少なくてこそ、最終合成された入力信号の品質が向上する。LPC係数の重要度を考慮せずに、同一に重要度を適用して量子化する場合、入力信号の品質は落ちてしまう。かような重要度を決定するための加重値関数が要求される。
一般的に、通信用音声符号化器は、5msのサブフレームと、20msのフレームとから構成される。GSM((登録商標)global system for mobile communication)及び3GPP(third generation partnership project)の音声符号化器であるAMRとAMR−WBは、5msのサブフレームが4個含まれた20msのフレームで構成される。
図9から分かるように、LPC係数の量子化は、以前フレームと現在フレームとを構成するサブフレームのうち、最後のフレームである第4のサブフレーム(フレームエンド)を中心に1回ずつ遂行される。現在フレームの最初、第2及び第3のサブフレームのためのLPC係数は、以前フレームのフレームエンドと、現在フレームのフレームエンドとに係わる量子化されたLPC係数を補間することによって決定される。
本発明の一実施形態によれば、音質向上のために、第2のサブフレームで線形予測分析を行って導き出されたLPC係数を符号化することができる。このとき、加重値関数決定部207は、以前フレームのフレームエンドに係わるLPC係数と、現在フレームのフレームエンドに係わるLPC係数とを利用して、中間サブフレームである現在フレームの第2のサブフレームについて、最適のinterpolation weightをclosed-loopで探索することができる。その後、16次LPC係数について、最もweighted distortionを最小化させるコードブック・インデックスが導き出されて伝送される。
Weighted distortionを求めるためには、16次LPC係数に係わる加重値関数が必要である。このとき、使用される加重値関数は、数式(11)の通りである。数式(11)によれば、ISF係数の間隔を分析し、ISF係数の間隔が狭いところにさらに多くの加重値が適用される。
Figure 0006317387
そして、数式(12)のように、追加的に低周波数強調(low frequency emphasis)が適用される。このとき、low frequency emphasisは、一次関数からなる数式である。
Figure 0006317387
本発明によれば、ISF係数やLSF係数の間隔のみを利用して、加重値関数が導き出されるので、非常に単純な方式によって複雑度が低い。一般的には、ISF係数の間隔が狭いところで、スペクトルエネルギーが高くて重要な成分である可能性が高いが、実際にスペクトル分析が行われれば、かような結果が正確にマッチングされない場合が頻繁に発生する。
従って、本発明の一実施形態によれば、類似した複雑度で、優秀な性能を有する量子化技術が提案される。提案した最初の方式は、以前フレームと現在フレームとの情報を補間して量子化する技術である。そして、第2の方式はLPC係数の周波数マッピングを介してスペクトル情報を決定し、スペクトル情報を介して、LPC係数の量子化のための最適の加重値関数を決定する技術である。
また本発明の一実施形態による方法は、多様なコンピュータで具現される動作を遂行するためのプログラム命令を含むコンピュータで読み取り可能な媒体を含む。前記コンピュータで読み取り可能な媒体は、プログラム命令、データファイル、データ構造などを単独で、または組み合わせて含んでもよい。前記媒体は、プログラム命令が、本発明のために特別に設計されて構成されたものや、コンピュータソフトウェア当業者に公知されて使用可能なものであってもよい。コンピュータで読み取り可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体(magnetic media);CD(compact disc)−ROM(read-only memory)、DVD(digital versatile disc)のような光記録媒体(optical media);フロプティカルディスク(floptical disk)のような磁気−光媒体(magneto-optical media);及びROM(read-only memory)、RAM(random-access memory)、フラッシュメモリなどのようなプログラム命令を保存して遂行するように特別に構成されたハードウェア装置;が含まれる。前記媒体は、プログラム命令、データ構造などを指定する信号を伝送する伝送媒体でってもよい。プログラム命令の例としては、コンパイラによって作われるような機械語コードだけではなく、インタープリタなどを使用してコンピュータによって実行される高級言語コードを含む。
以上のように、本発明の一実施形態は、たとえ限定された実施形態と図面とによって説明されたにしても、本発明の一実施形態は、前述の実施形態に限定されるものではなく、本発明が属する分野で当業者であるならば、かような記載から多様な修正及び変形が可能である。従って、本発明の一実施形態は、特許請求の範囲によってのみ把握されるものであり、それと均等であったり、等価である変形は、いずれも本発明思想の範疇に属するものである。
なお、次の付記を記す。
(付記1) 入力信号の中間サブフレームの線形予測符号化(LPC)係数を、線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数のうちいずれか一つに変換する第1係数変換部と、
前記変換されたISF係数またはLSF係数を利用して、前記中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する加重値関数決定部と、
前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する量子化部と、
少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する第2係数変換部と、を含み、
前記量子化されたLPC係数は、装置のエンコーダに出力される装置。
(付記2) 前記加重値関数決定部は、
現在フレームのパラメータと、以前フレームのパラメータとを補間し、前記中間サブフレームのLPC係数を量子化するための加重値関数を決定することを特徴とする付記1に記載の装置。
(付記3) 前記加重値関数決定部は、
前記以前フレームのフレームエンドのLPC係数を量子化するための第1加重値関数と、前記現在フレームのフレームエンドのLPC係数を量子化するための第2加重値関数とを補間し、前記中間サブフレームのLPC係数を量子化するための加重値関数を決定することを特徴とする付記2に記載の装置。
(付記4) 前記加重値関数決定部は、
線形補間及び非線形補間のうち少なくとも一つを利用して補間を行い、(1)線形補間及び非線形補間を、全ての次数のベクトルに適用する方式、(2)サブベクトルごとに線形補間と非線形補間とを異ならせて適用する方式、(3)それぞれのLPC係数によって、線形補間と非線形補間とを異ならせて適用する方式のうちいずれか一つを遂行することを特徴とする付記2に記載の装置。
(付記5) 前記加重値関数決定部は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応する補間されたスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記1に記載の装置。
(付記6) 前記補間されたスペクトルサイズは、
現在フレームのフレームエンドのスペクトルサイズと、以前フレームのフレームエンドのスペクトルサイズとが補間された結果であることを特徴とする付記5に記載の装置。
(付記7) 前記加重値関数決定部は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と周辺周波数とに対応するスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記5に記載の装置。
(付記8) 前記加重値関数決定部は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して、加重値関数を決定することを特徴とする付記7に記載の装置。
(付記9) 前記加重値関数決定部は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応するLPCスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記1に記載の装置。
(付記10) 前記LPCスペクトルサイズは、
中間サブフレームのLPC係数を周波数変換したLPCスペクトルに基づいて決定されることを特徴とする付記9に記載の装置。
(付記11) 前記加重値関数決定部は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と、周辺周波数とに対応するスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記9に記載の装置。
(付記12) 前記加重値関数決定部は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と、周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して、加重値関数を決定することを特徴とする付記11に記載の装置。
(付記13) 前記加重値関数決定部は、
前記中間サブフレームの周波数帯域、符号化モード情報または周波数分析情報のうち少なくとも一つに基づいて、加重値関数を決定することを特徴とする付記1に記載の装置。
(付記14) 前記加重値関数決定部は、
LPCスペクトルサイズまたは補間されたスペクトルサイズのうち少なくとも一つに基づいて、決定されたサイズ別加重値関数と、周波数別加重値関数とを組み合わせ、最終的な加重値関数を決定することを特徴とする付記1に記載の装置。
(付記15) 前記周波数別加重値関数は、
前記中間サブフレームのLPC係数から変換されたISF係数またはLSF係数の周波数に対応する加重値関数であることを特徴とする付記14に記載の装置。
(付記16) 前記周波数別加重値関数は、
バークスケールで表現されることを特徴とする付記14に記載の装置。
(付記17) 入力信号の中間サブフレームの線形予測符号化(LPC)係数を、線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数のうちいずれか一つに変換する段階と、
前記変換されたISF係数またはLSF係数を利用して、前記中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する段階と、
前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する段階と、
少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する段階と、を含み、
前記量子化されたLPC係数は、エンコーダに出力される方法。
(付記18) 前記加重値関数を決定する段階は、
現在フレームのパラメータと、以前フレームのパラメータとを補間し、前記中間サブフレームのLPC係数を量子化するための加重値関数を決定することを特徴とする付記17に記載の方法。
(付記19) 前記加重値関数を決定する段階は、
前記以前フレームのフレームエンドのLPC係数を量子化するための第1加重値関数と、前記現在フレームのフレームエンドのLPC係数を量子化するための第2加重値関数とを補間し、前記中間サブフレームのLPC係数を量子化するための加重値関数を決定することを特徴とする付記18に記載の方法。
(付記20) 前記加重値関数を決定する段階は、
線形補間及び非線形補間のうち少なくとも一つを利用して補間を行い、(1)線形補間及び非線形補間を、全ての次数のベクトルに適用する方式、(2)サブベクトルごとに線形補間と非線形補間とを異ならせて適用する方式、(3)それぞれのLPC係数によって、線形補間と非線形補間とを異ならせて適用する方式のうちいずれか一つを遂行することを特徴とする付記18に記載の方法。
(付記21) 前記加重値関数を決定する段階は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応する補間されたスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記17に記載の方法。
(付記22) 前記補間されたスペクトルサイズは、
現在フレームのフレームエンドのスペクトルサイズと、以前フレームのフレームエンドのスペクトルサイズとが補間された結果であることを特徴とする付記21に記載の方法。
(付記23) 前記加重値関数を決定する段階は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と、周辺周波数とに対応するスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記21に記載の方法。
(付記24) 前記加重値関数を決定する段階は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と、周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して、加重値関数を決定することを特徴とする付記23に記載の方法。
(付記25) 前記加重値関数を決定する段階は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数に対応するLPCスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記17に記載の方法。
(付記26) 前記LPCスペクトルサイズは、
中間サブフレームのLPC係数を周波数変換したLPCスペクトルに基づいて決定されることを特徴とする付記25に記載の方法。
(付記27) 前記加重値関数を決定する段階は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と、周辺周波数とに対応するスペクトルサイズを利用して、前記ISF係数またはLSF係数に係わる加重値関数を決定することを特徴とする付記25に記載の方法。
(付記28) 前記加重値関数を決定する段階は、
前記LPC係数から変換されたISF係数またはLSF係数の周波数と、周辺周波数とに対応するスペクトルサイズの最大値、平均値または中間値を利用して、加重値関数を決定することを特徴とする付記27に記載の方法。
(付記29) 前記加重値関数を決定する段階は、
前記中間サブフレームの周波数帯域、符号化モード情報または周波数分析情報のうち少なくとも一つに基づいて、加重値関数を決定することを特徴とする付記17に記載の方法。
(付記30) 前記加重値関数を決定する段階は、
LPCスペクトルサイズまたは補間されたスペクトルサイズのうち少なくとも一つに基づいて、決定されたサイズ別加重値関数と、周波数別加重値関数とを組み合わせ、最終的な加重値関数を決定することを特徴とする付記17に記載の方法。
(付記31) 前記周波数別加重値関数は、
前記中間サブフレームのLPC係数から変換されたISF係数またはLSF係数の周波数に対応する加重値関数であることを特徴とする付記30に記載の方法。
(付記32) 前記周波数別加重値関数は、
バークスケールで表現されることを特徴とする付記30に記載の方法。
(付記33) 付記17に記載の方法を遂行するために、少なくとも1つのプロセッサを制御するためのコンピュータで読み取り可能な命令語が記録されていることを特徴とするコンピュータで読み取り可能な記録媒体。
(付記34) 線形予測符号化(LPC)係数に対応する線スペクトル周波数(LSF)係数、またはイミッタンススペクトル周波数(ISF)係数を利用して、入力信号の中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する加重値関数決定部と、
前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する量子化部と、
少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する第2係数変換部と、を含み、前記量子化されたLPC係数は、装置のエンコーダに出力される装置。
(付記35) 線形予測符号化(LPC)係数に対応する線スペクトル周波数(LSF)係数、またはイミッタンススペクトル周波数(ISF)係数を利用して、入力信号の中間サブフレームのLPC係数の重要度と係わる加重値関数を決定する段階と、
前記決定された加重値関数を利用して、前記変換されたISF係数またはLSF係数を量子化する段階と、
少なくとも1つのプロセッサを使用して、前記量子化されたISF係数またはLSF係数を、量子化されたLPC係数に変換する段階と、を含み、前記量子化されたLPC係数は、エンコーダに出力される方法。
(付記36) 付記35に記載の方法を遂行するために、少なくとも1つのプロセッサを制御するためのコンピュータで読み取り可能な命令語が記録されていることを特徴とするコンピュータで読み取り可能な記録媒体。

Claims (8)

  1. 加重値関数の決定方法であって、
    入力信号のサブフレームの線形予測符号化(LPC)係数から、線スペクトル周波数(LSF)係数またはイミッタンススペクトル周波数(ISF)係数を得るステップと、
    記サブフレームのスペクトルビンの数に基づいて前記LSF係数またはISF係数を正規化するステップと、
    前記サブフレームの、正規化されたLSF係数または正規化されたISF係数の周波数に対応するスペクトルビンのサイズに基づいて前記サブフレームの加重値関数を決定するステップと、
    を含む方法。
  2. 前記加重値関数を決定するステップは、前記正規化されたLSF係数または正規化されたISF係数の周波数に対応するスペクトルビンのサイズと少なくとも一つの隣接するスペクトルビンのサイズに基づく、請求項1に記載の方法。
  3. 前記加重値関数を決定するステップは、前記正規化されたLSF係数または正規化されたISF係数の周波数に対応するスペクトルビンのサイズと少なくとも一つの隣接するスペクトルビンのサイズの中で最大値に基づく、請求項1に記載の方法。
  4. 前記スペクトルビンは、前記入力信号の時間-周波数マッピングから得る、
    請求項1に記載の方法。
  5. 前記時間-周波数マッピングは、高速フーリエ変換(Fast Fourier Transform)によって実行される、請求項4に記載の方法。
  6. 前記加重値関数を決定するステップは、前記正規化されたLSF係数または正規化されたISF係数の周波数に対応するスペクトルビンのサイズに基づく第1の加重値関数と前記正規化されたLSF係数または正規化されたISF係数の周波数情報に基づく第2の加重値関数を結合して前記加重値関数を決定する、請求項1に記載の方法。
  7. 前記周波数情報は、前記入力信号の符号化モードに対応して得られる、請求項6に記載の方法。
  8. 前記第2の加重値関数は、前記入力信号の知覚的特性とフォルマント分布の中で少なくとも一つに基づく、請求項6に記載の方法。

JP2016077549A 2010-10-18 2016-04-07 加重値関数決定方法 Active JP6317387B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020100101305A KR101747917B1 (ko) 2010-10-18 2010-10-18 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
KR10-2010-0101305 2010-10-18

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013534808A Division JP5918249B2 (ja) 2010-10-18 2011-10-18 線形予測符号化係数を量子化するための低複雑度を有する加重値関数決定装置及びその方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018065492A Division JP6571827B2 (ja) 2010-10-18 2018-03-29 加重値関数決定方法

Publications (2)

Publication Number Publication Date
JP2016130868A JP2016130868A (ja) 2016-07-21
JP6317387B2 true JP6317387B2 (ja) 2018-04-25

Family

ID=45934871

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2013534808A Active JP5918249B2 (ja) 2010-10-18 2011-10-18 線形予測符号化係数を量子化するための低複雑度を有する加重値関数決定装置及びその方法
JP2016077549A Active JP6317387B2 (ja) 2010-10-18 2016-04-07 加重値関数決定方法
JP2018065492A Active JP6571827B2 (ja) 2010-10-18 2018-03-29 加重値関数決定方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013534808A Active JP5918249B2 (ja) 2010-10-18 2011-10-18 線形予測符号化係数を量子化するための低複雑度を有する加重値関数決定装置及びその方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2018065492A Active JP6571827B2 (ja) 2010-10-18 2018-03-29 加重値関数決定方法

Country Status (12)

Country Link
US (3) US9311926B2 (ja)
EP (4) EP4195203A1 (ja)
JP (3) JP5918249B2 (ja)
KR (1) KR101747917B1 (ja)
CN (4) CN105825860B (ja)
CA (2) CA2958164C (ja)
ES (1) ES2947874T3 (ja)
MX (2) MX342308B (ja)
MY (3) MY183019A (ja)
PL (1) PL3869508T3 (ja)
SG (2) SG189452A1 (ja)
WO (1) WO2012053798A2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
RU2643646C2 (ru) 2013-11-13 2018-02-02 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер для кодирования аудиосигнала, система передачи аудио и способ определения значений коррекции
EP3091536B1 (en) * 2014-01-15 2019-12-11 Samsung Electronics Co., Ltd. Weight function determination for a quantizing linear prediction coding coefficient
EP2916319A1 (en) 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information
SG11201608787UA (en) * 2014-03-28 2016-12-29 Samsung Electronics Co Ltd Method and device for quantization of linear prediction coefficient and method and device for inverse quantization
BR112016022466B1 (pt) 2014-04-17 2020-12-08 Voiceage Evs Llc método para codificar um sinal sonoro, método para decodificar um sinal sonoro, dispositivo para codificar um sinal sonoro e dispositivo para decodificar um sinal sonoro
KR101972007B1 (ko) * 2014-04-24 2019-04-24 니폰 덴신 덴와 가부시끼가이샤 주파수 영역 파라미터열 생성 방법, 부호화 방법, 복호 방법, 주파수 영역 파라미터열 생성 장치, 부호화 장치, 복호 장치, 프로그램 및 기록 매체
EP3471095B1 (en) * 2014-04-25 2024-05-01 Ntt Docomo, Inc. Linear prediction coefficient conversion device and linear prediction coefficient conversion method
CN105096958B (zh) * 2014-04-29 2017-04-12 华为技术有限公司 音频编码方法及相关装置
KR20230149335A (ko) * 2014-05-07 2023-10-26 삼성전자주식회사 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
FR3023036A1 (fr) * 2014-06-27 2016-01-01 Orange Re-echantillonnage par interpolation d'un signal audio pour un codage / decodage a bas retard
CN105225670B (zh) 2014-06-27 2016-12-28 华为技术有限公司 一种音频编码方法和装置
CN104269176B (zh) * 2014-09-30 2017-11-24 武汉大学深圳研究院 一种isf系数矢量量化的方法与装置
KR102298767B1 (ko) * 2014-11-17 2021-09-06 삼성전자주식회사 음성 인식 시스템, 서버, 디스플레이 장치 및 그 제어 방법
CN110660402B (zh) * 2018-06-29 2022-03-29 华为技术有限公司 立体声信号编码过程中确定加权系数的方法和装置
BR112021012753A2 (pt) * 2019-01-13 2021-09-08 Huawei Technologies Co., Ltd. Método implementado por computador para codificação de áudio, dispositivo eletrônico e meio legível por computador não transitório
US11955138B2 (en) * 2019-03-15 2024-04-09 Advanced Micro Devices, Inc. Detecting voice regions in a non-stationary noisy environment
CN113554103B (zh) * 2021-07-28 2022-05-27 大连海天兴业科技有限公司 一种列车走行部滚动轴承故障诊断算法

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5265190A (en) * 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
US5448680A (en) * 1992-02-12 1995-09-05 The United States Of America As Represented By The Secretary Of The Navy Voice communication processing system
JP2746039B2 (ja) * 1993-01-22 1998-04-28 日本電気株式会社 音声符号化方式
CA2154911C (en) 1994-08-02 2001-01-02 Kazunori Ozawa Speech coding device
JP3153075B2 (ja) 1994-08-02 2001-04-03 日本電気株式会社 音声符号化装置
JP3283152B2 (ja) 1995-02-27 2002-05-20 松下電器産業株式会社 音声パラメータ量子化装置およびベクトル量子化装置
US5754733A (en) 1995-08-01 1998-05-19 Qualcomm Incorporated Method and apparatus for generating and encoding line spectral square roots
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JPH10124092A (ja) 1996-10-23 1998-05-15 Sony Corp 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
JPH10276095A (ja) 1997-03-28 1998-10-13 Toshiba Corp 符号化器及び復号化器
JPH11143498A (ja) 1997-08-28 1999-05-28 Texas Instr Inc <Ti> Lpc係数のベクトル量子化方法
TW408298B (en) 1997-08-28 2000-10-11 Texas Instruments Inc Improved method for switched-predictive quantization
US6889185B1 (en) 1997-08-28 2005-05-03 Texas Instruments Incorporated Quantization of linear prediction coefficients using perceptual weighting
US5966688A (en) * 1997-10-28 1999-10-12 Hughes Electronics Corporation Speech mode based multi-stage vector quantizer
JP3357829B2 (ja) * 1997-12-24 2002-12-16 株式会社東芝 音声符号化/復号化方法
JP3365360B2 (ja) * 1999-07-28 2003-01-08 日本電気株式会社 音声信号復号方法および音声信号符号化復号方法とその装置
US7389227B2 (en) * 2000-01-14 2008-06-17 C & S Technology Co., Ltd. High-speed search method for LSP quantizer using split VQ and fixed codebook of G.729 speech encoder
US6778953B1 (en) * 2000-06-02 2004-08-17 Agere Systems Inc. Method and apparatus for representing masked thresholds in a perceptual audio coder
EP1303857A1 (en) * 2000-07-05 2003-04-23 Koninklijke Philips Electronics N.V. Method of converting line spectral frequencies back to linear prediction coefficients
KR100383668B1 (ko) * 2000-09-19 2003-05-14 한국전자통신연구원 시간 분리 부호화 알고리즘을 이용한 음성 부호화기 및부호화 방법
EP1339040B1 (en) 2000-11-30 2009-01-07 Panasonic Corporation Vector quantizing device for lpc parameters
KR20020075592A (ko) * 2001-03-26 2002-10-05 한국전자통신연구원 광대역 음성 부호화기용 lsf 양자화기
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
US7610198B2 (en) * 2001-08-16 2009-10-27 Broadcom Corporation Robust quantization with efficient WMSE search of a sign-shape codebook using illegal space
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
WO2003089892A1 (en) 2002-04-22 2003-10-30 Nokia Corporation Generating lsf vectors
KR100474969B1 (ko) 2002-06-04 2005-03-10 에스엘투 주식회사 음성신호 부호화를 위한 선 스펙트럼 계수의 벡터 양자화방법과 이를 위한 마스킹 임계치 산출 방법
WO2004008437A2 (en) * 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
JP4413480B2 (ja) * 2002-08-29 2010-02-10 富士通株式会社 音声処理装置及び移動通信端末装置
US20040083097A1 (en) * 2002-10-29 2004-04-29 Chu Wai Chung Optimized windows and interpolation factors, and methods for optimizing windows, interpolation factors and linear prediction analysis in the ITU-T G.729 speech coding standard
KR100499047B1 (ko) * 2002-11-25 2005-07-04 한국전자통신연구원 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의 상호부호화 장치 및 그 방법
KR100503415B1 (ko) * 2002-12-09 2005-07-22 한국전자통신연구원 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법
CA2521099A1 (en) * 2003-04-09 2004-10-28 Brigham Young University Cross-flow ion mobility analyzer
EP1513137A1 (en) 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Speech processing system and method with multi-pulse excitation
US20050065787A1 (en) 2003-09-23 2005-03-24 Jacek Stachurski Hybrid speech coding and system
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
WO2005096274A1 (fr) 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
CN1677493A (zh) 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
WO2006030865A1 (ja) * 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置
KR100647290B1 (ko) 2004-09-22 2006-11-23 삼성전자주식회사 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법
KR20060067016A (ko) 2004-12-14 2006-06-19 엘지전자 주식회사 음성 부호화 장치 및 방법
US8150684B2 (en) * 2005-06-29 2012-04-03 Panasonic Corporation Scalable decoder preventing signal degradation and lost data interpolation method
CN101385079B (zh) 2006-02-14 2012-08-29 法国电信公司 在音频编码/解码中用于知觉加权的设备
WO2007114290A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
KR100902332B1 (ko) 2006-09-11 2009-06-12 한국전자통신연구원 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화장치 및 그 방법
KR100788706B1 (ko) * 2006-11-28 2007-12-26 삼성전자주식회사 광대역 음성 신호의 부호화/복호화 방법
US20080195381A1 (en) * 2007-02-09 2008-08-14 Microsoft Corporation Line Spectrum pair density modeling for speech applications
EP2301021B1 (en) * 2008-07-10 2017-06-21 VoiceAge Corporation Device and method for quantizing lpc filters in a super-frame
KR101660843B1 (ko) * 2010-05-27 2016-09-29 삼성전자주식회사 Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법
KR101747917B1 (ko) 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
AU2012246799B2 (en) * 2011-04-21 2016-03-03 Samsung Electronics Co., Ltd. Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium
CN105336337B (zh) * 2011-04-21 2019-06-25 三星电子株式会社 针对语音信号或音频信号的量化方法以及解码方法和设备
EP3091536B1 (en) * 2014-01-15 2019-12-11 Samsung Electronics Co., Ltd. Weight function determination for a quantizing linear prediction coding coefficient

Also Published As

Publication number Publication date
CA2814944A1 (en) 2012-04-26
JP5918249B2 (ja) 2016-05-18
JP2018120241A (ja) 2018-08-02
EP3869508A1 (en) 2021-08-25
JP2016130868A (ja) 2016-07-21
US20170358309A1 (en) 2017-12-14
CN105825860B (zh) 2020-05-26
EP3869508C0 (en) 2023-06-07
WO2012053798A2 (en) 2012-04-26
MY165854A (en) 2018-05-18
US10580425B2 (en) 2020-03-03
KR101747917B1 (ko) 2017-06-15
KR20120039865A (ko) 2012-04-26
JP2013541737A (ja) 2013-11-14
CA2814944C (en) 2017-03-28
CA2958164C (en) 2020-04-14
CN105825861B (zh) 2020-04-10
CN103262161A (zh) 2013-08-21
ES2947874T3 (es) 2023-08-23
US9311926B2 (en) 2016-04-12
CN105825861A (zh) 2016-08-03
CN105741846B (zh) 2020-04-10
MX342308B (es) 2016-09-26
US9773507B2 (en) 2017-09-26
MY181446A (en) 2020-12-22
EP3029670A1 (en) 2016-06-08
WO2012053798A3 (en) 2012-06-14
EP2630641A2 (en) 2013-08-28
US20120095756A1 (en) 2012-04-19
SG189452A1 (en) 2013-05-31
MX2013004342A (es) 2013-06-28
PL3869508T3 (pl) 2023-10-02
JP6571827B2 (ja) 2019-09-04
US20160225380A1 (en) 2016-08-04
CA2958164A1 (en) 2012-04-26
CN105825860A (zh) 2016-08-03
SG10201401664XA (en) 2014-08-28
EP4195203A1 (en) 2023-06-14
EP3029670B1 (en) 2021-12-01
EP2630641A4 (en) 2014-08-27
MY183019A (en) 2021-02-05
EP3869508B1 (en) 2023-06-07
CN105741846A (zh) 2016-07-06

Similar Documents

Publication Publication Date Title
JP6571827B2 (ja) 加重値関数決定方法
KR102461280B1 (ko) 선형 예측 부호화 계수를 양자화하기 위한 가중치 함수 결정 장치 및 방법
US10395665B2 (en) Apparatus and method determining weighting function for linear prediction coding coefficients quantization
KR101761820B1 (ko) Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법
KR101857799B1 (ko) 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
KR101997897B1 (ko) 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
KR101867596B1 (ko) Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170620

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170920

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180329

R150 Certificate of patent or registration of utility model

Ref document number: 6317387

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250