JP6323881B2 - 信号符号化および復号化の方法および装置 - Google Patents

信号符号化および復号化の方法および装置 Download PDF

Info

Publication number
JP6323881B2
JP6323881B2 JP2016175647A JP2016175647A JP6323881B2 JP 6323881 B2 JP6323881 B2 JP 6323881B2 JP 2016175647 A JP2016175647 A JP 2016175647A JP 2016175647 A JP2016175647 A JP 2016175647A JP 6323881 B2 JP6323881 B2 JP 6323881B2
Authority
JP
Japan
Prior art keywords
frequency domain
signal
domain signal
frequency
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016175647A
Other languages
English (en)
Other versions
JP2017016141A (ja
Inventor
▲澤▼新 ▲劉▼
▲澤▼新 ▲劉▼
磊 苗
磊 苗
峰岩 ▲斉▼
峰岩 ▲斉▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2017016141A publication Critical patent/JP2017016141A/ja
Application granted granted Critical
Publication of JP6323881B2 publication Critical patent/JP6323881B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L27/00Modulated-carrier systems
    • H04L27/26Systems using multi-frequency codes
    • H04L27/2601Multicarrier modulation systems
    • H04L27/2602Signal structure
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L5/00Arrangements affording multiple use of the transmission path
    • H04L5/02Channels characterised by the type of signal
    • H04L5/06Channels characterised by the type of signal the signals being represented by different frequencies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

関連出願の記載
本願は、発明の名称を「信号符号化および復号化の方法および装置」とした2012年3月29日に中国国家知的産権局に出願された中国特許出願第201210087702.9号に対する優先権を主張し、引用によりその全体を本明細書に取り込む。
本発明の諸態様は通信分野に関し、特に、信号の符号化と復号化のための方法と装置に関する。
モバイル通信や光ファイバ通信のような通信の分野では、符号化技術を送信側で使用して送信すべき信号を圧縮し、送信効率を高め、対応する復号化技術を受信側で使用して送信された信号を復元する。信号の特性、送信条件等に従って、時間領域符号化および/または周波数領域符号化が当該信号に対して実施されることがある。符号化のための様々なビットが特定の規則に従って時間領域信号または周波数領域信号に割り当てられ、次いで当該信号が、符号化方法を用いて、割り当てられたビットに従って符号化される。信号送信効率を高めるには、送信すべき信号ができる限り少ない符号化ビットを用いて表されるということが期待される。したがって、出力信号が復号化を用いて受信側で最小の歪みで復元されるように、符号化ビットを正しく割り当てる必要がある。
音声信号に対する既存の符号化器では、符号化率が低いときには、符号化および復号化の効果は一般に会話に対しては良好かもしれないが、音楽に対しては符号化と復号化の効果は貧弱である。符号化率が低いときに音楽の品質を高めるために、幾つかのビットおよび時間領域符号化方法を用いて入力信号を符号化し、周波数領域信号が当該入力信号に従って取得され、残りのビットと周波数領域符号化方法を用いて当該周波数領域信号を符号化する。残りのビットを用いて当該周波数領域信号を符号化するときには、当該信号の特徴は一般的に考慮されず、ビット割当てが均一に当該周波数領域信号に対して実施され、これが一部の周波数領域信号に対して貧弱な符号化効果をもたらす。音声信号に対する既存の復号化器では、符号化技術に対応する復号化技術を単純に使用することによって当該周波数領域信号が復元され、復号化で得られなかった周波数領域信号が雑音で埋められ、周波数領域逆変換および時間領域合成処理を実施して出力信号を取得する。当該雑音で一部の信号が埋められるときには余分な雑音が導入され、これが出力信号の品質を低下させる。
したがって、均一なビット割当てを周波数領域符号化アルゴリズムで実施する既存の解決策では一部の信号に対して符号化効果が貧弱なものとなり、既存の周波数領域復号化アルゴリズムにおける上述の雑音埋め処理では出力信号の品質が低下する。
本発明の諸実施形態では、信号符号化および復号化の方法および装置を提供する。符号化の最中に、同数のビットを用いることで周波数領域信号のビット割当てを最適化し、良好な符号化効果を達成することができ、復号化の最中には、周波数領域励起信号を、周波数領域復号化による復号化で得られた情報の誘導のもとに拡張して、出力信号の良好な効果を達成することができる。
1態様によれば、信号符号化方法を提供する。当該方法は、入力信号に従って周波数領域信号を取得するステップと、所定の割当て規則に従って所定のビットを当該周波数領域信号に割り当てるステップと、ビットが割り当てられる周波数領域信号の最高周波数が所定値より大きいときに当該周波数領域信号に対するビット割当てを調節するステップと、当該周波数領域信号に対するビット割当てに従って当該周波数領域信号を符号化するステップとを含む。
別の態様によれば、信号復号化方法を提供する。当該方法は、受信したビット・ストリームから、復号化で得られた周波数領域信号を取得するステップと、復号化で得られた周波数領域信号が所定条件を満たすとき、復号化で得られた周波数領域信号に従って、復号化で得られなかった周波数領域信号を予測するステップと、復号化で得られた周波数領域信号と復号化で得られなかった当該予測した周波数領域信号に従って、最終的に出力される時間領域信号を取得するステップと、を含む。
さらに別の態様によれば、信号符号化装置を提供する。当該装置は、入力信号に従って周波数領域信号を取得する周波数領域変換ユニットと、所定の割当て規則に従って所定のビットを当該周波数領域信号に割り当てるビット割当てユニットと、ビットが割り当てられる周波数領域信号の最高周波数が所定値以上であるとき、当該周波数領域信号に対するビット割当てを調節するビット調整ユニットと、当該周波数領域信号に対するビット割当てに従って当該周波数領域信号を符号化する周波数領域符号化ユニットとを備える。
さらに別の態様によれば、信号復号化装置を提供する。当該装置は、受信したビット・ストリームから、復号化で得られた周波数領域信号を取得する復号化ユニットと、復号化で得られなかった周波数領域信号を予測し、復号化で得られた周波数領域信号が所定条件を満たすとき、復号化で得られた周波数領域信号に従って、復号化で得られなかった周波数領域信号を予測するように構成された帯域幅拡張ユニットと、復号化で得られた周波数領域信号と当該予測した周波数領域信号に従って、最終的に出力される時間領域信号を取得する出力ユニットとを備える。
本発明の諸実施形態の上述の技術的解決策では、符号化の最中に、周波数領域信号のビット割当てをビットが割り当てられる周波数領域信号の最高周波数に従って調節する。その結果、同数のビットを用いて周波数領域符号化を実施するときに良好な符号化効果が達成される。復号化の最中には、復号化で得られなかった周波数領域信号を復号化で得られた周波数領域信号の誘導のもとに設定し、出力信号の良好な効果を達成する。
本発明の諸実施形態の技術的解決策をより明確に説明するために、以下では当該諸実施形態または先行技術を説明するのに必要な添付図面を簡単に説明する。明らかに、以下の説明における添付図面は本発明の諸実施形態の一部を示すにすぎず、当業者は創造的作業なしにこれらの添付図面から他の図面を導出することができる。
本発明の1実施形態に従う信号符号化方法の図である。 本発明の1実施形態における符号化方法を用いた時間周波数結合符号化方法の図である。 本発明の1実施形態に従う信号復号化方法の図である。 時間周波数結合復号化方法における、受信したビット・ストリームから、復号化で得られた周波数領域信号を取得するための方法を示す図である。 本発明に従う符号化装置および/または復号化装置の例示的な実装形態を示す図である。 本発明の1実施形態に従う符号化信号符号化装置の図である。 本発明の1実施形態における符号化装置を用いた時間周波数結合符号化装置の図である。 本発明の1実施形態に従う信号復号化装置の図である。 時間周波数結合復号化における復号化ユニットのブロック図である。
以下で、本発明の諸実施形態における添付図面を参照して本発明の諸実施形態の技術的解決策を明確かつ十分に説明する。明らかに、説明する諸実施形態は本発明の諸実施形態の一部であって当該諸実施形態の全部ではない。当業者が創造的作業なしに本発明の諸実施形態に基づいて取得する他の全ての実施形態は本発明の保護範囲に入るものとする。
本発明における符号化技術の解決策と復号化技術の解決策を、様々な通信システムにおける送受信に適用してもよい。当該通信システムは例えば、GSM(登録商標)、符号分割多重アクセス(CDMA、Code Division Multiple Access)システム、広帯域符号分割多重アクセス(WCDMA(登録商標)、Wideband Code Division Multiple Access Wireless)、汎用パケット無線サービス(GPRS、General Packet Radio Service)、およびロング・ターム・エボリューション(LTE、Long Term Evolution)である。
符号化技術の解決策および復号化技術の解決策は、様々な電子装置、例えば、携帯電話、無線機器、携帯情報端末(PDA)、ハンドヘルド・コンピュータまたはポータブル・コンピュータ、GPS受信器/ナビゲータ、カメラ、オーディオ/ビデオプレイヤ、ビデオカメラ、ビデオ・レコーダ、監視装置、等に広く適用される。一般に、この種の電子装置には、オーディオ符号化器またはオーディオ復号化器が含まれ、当該オーディオ符号化器または復号化器を、デジタル回路またはチップ、例えばDSP(digital signal processor)で直接実装することができ、または、ソフトウェア・コードがプロセッサを駆動して当該ソフトウェア・コード内の手続きを実施させることで実装することができる。
1例として、オーディオ符号化技術の解決策では、先ず、オーディオ時間領域信号は周波数領域信号に変換され、次いで符号化ビットが符号化のためのオーディオ周波数領域信号に割り当てられ、符号化された信号が、通信システムを用いることによって復号側に送信され、符号化された信号が復号側で復号化されて当該周波数領域信号を復元する。
図1は、本発明の1実施形態に従う信号符号化方法100を示す。図1に示すように、当該方法は以下を含む。
110では、周波数領域信号を入力信号に従って取得する。当該入力信号は、画像信号、データ信号、音声信号、ビデオ信号、またはテキスト信号のような様々な種類のものであってもよい。高速フーリエ変換(FFT、Fast Fourier Transform)または離散余弦変換(DCT、Discrete Cosine Transform)のようなアルゴリズムを用いることによって周波数領域変換を入力信号に対して実施して、当該周波数領域信号を取得してもよい。当該入力信号と周波数領域変換アルゴリズムのタイプは本発明に対する限定を構成しない。
120では、所定の割当て規則に従って所定のビットを当該周波数領域信号に割り当てる。当該所定数tot_bitのビットは、周波数領域符号化を当該周波数領域信号に対して実施するために使用する必要があるビットである。当該所定の割当て規則は、例えば、当該所定のビットにおけるより多くのビットが当該周波数領域信号における低周波数帯信号に割り当てられ、当該所定のビットにおける残りのビットが、当該低周波数帯信号を除いてより大きなエネルギの周波数帯に割り当てられるというものであってもよい。より多くのビットを全ての低周波数帯に対して低周波数帯信号に均一に割り当ててもよく、または、より多くのビットを低周波数帯信号のエネルギ分布に従って低周波数帯信号に割り当ててもよい。より多くのビットを低周波数帯信号に割り当てる理由は、会話/音声信号等においては、低周波数帯信号は一般に人間の耳に対してより敏感な情報を含むからである。
以下では、音声信号の周波数領域符号化を1例として用いて説明する。周波数領域符号化の最中に、当該周波数領域信号は一般に周波数に従って均等な間隔でサブバンドに分割され、または、周波数領域係数に従ってサブバンドに分割され、例えば、16個の周波数領域係数ごとに1つのサブバンドに分割される。例えば、フレーム長が20msである広帯域信号に対して、0乃至4kHzの周波数範囲にある160個の係数が10個のサブバンドに分割され、5個のサブバンドが0乃至2kHzの周波数範囲に存在し、5個のサブバンドが2乃至4kHzの周波数範囲に存在する。次に、ビット割当てをサブバンドごとに実施する。量が1F_bitであるより多くのビットが0乃至2kHzの周波数範囲における低周波数領域信号に割り当てられ、rest_bit個の残りのビットがtot_bit個の所定のビットから1F_bitを差し引くことによって得られ、残りのビットrest_bitが、2乃至4kHzの周波数範囲の各サブバンドのエンベロープのサイズに従って2乃至4kHzの周波数範囲のサブバンドに割り当てられる。各サブバンドは5ビットを有する。ビットが割り当てられるサブバンドおよびビットが割り当てられる最高周波数帯のサブバンドlast_binの数が、rest_bitと各サブバンドのエンベロープのサイズに従って決定され、同時に、5でぴったり除すことができない残余を0乃至2kHzの範囲の各サブバンドに均等に割り当てる。
130では、ビットが割り当てられる周波数領域信号の最高周波数が所定値より大きいときに、当該周波数領域信号に対するビット割当てを調節する。所定値Bを経験値に従って設定してもよい。1実施形態では、所定値Bを、tot_bit個の当該所定のビットのおよび当該周波数領域信号の解像度に従って決定してもよい(例えば、320個の周波数領域係数が0乃至8kHzの帯域幅範囲に存在する)。固定帯域幅のケースでは、より大きな数tot_bitの当該所定のビットが大きな所定値Bを示す。当該所定のビットのビット数tot_bitが固定されているときには、高い解像度の当該周波数領域信号が大きな所定値Bを示す。帯域幅が固定され当該周波数領域信号の解像度も固定されているときには、所定値Bを当該所定のビットのビット数tot_bitのみに従って決定してもよく、より大きなビット数tot_bitの所定のビットが大きな所定値Bを示す。所定値Bは事前設定された上限周波数値である。例えば、経験から、周波数領域変換を入力信号に対して実施した後に、一般に周波数が当該所定値より大きな周波数領域信号にビットが割り当てられないと推定される。したがって、具体的な実施においては、所定値Bを、当該周波数領域信号の最高周波数の値より小さな特定の周波数、例えば、2.9kHz、3.2kHz、3.5kHz等に設定してもよい。別の実施形態では、所定値Bを、フレーム長、使用する変換方法、または変換ウィンドウ長のような別の因子に従って決定してもよい。
当該周波数領域信号をサブバンドに分割して符号化するとき、所定値Bは0乃至8kHzの周波数範囲における20個のサブバンドのインデックス番号であってもよく、ビットが割り当てられる周波数領域信号の最高周波数を、当該最高周波数が位置するサブバンドのインデックス番号を用いて表してもよい。例えば、標本化速度が16kHzである広帯域信号に対して、フレーム長は20msである。送信速度が6.8kbpsである場合には、Bはサブバンドの全数(20)と割り当てられる所定のビットの数(6.8kbps×20ms=136ビット)とに従って6に設定される。送信速度が7.6kbpsである場合には、Bはサブバンドの全数(20)と割り当てられる所定のビットの数(7.6kbps×20ms=152ビット)に従って8に設定される。纏めると、所定値Bとビットが割り当てられる周波数領域信号の最高周波数は、周波数の数値に限定されず、サブバンドのインデックス番号であってもよい。本発明の諸実施形態の開示を読めば、当業者は、実際の条件に従って、ビットが割り当てられる周波数領域信号の最高周波数が所定値より大きいかどうかの判定の仕方を理解する。
以下では、周波数領域信号に対するビット割当ての調節を説明する。信号の種類、周波数領域特性等に従って、復号側での出力にあまり寄与しない部分の当該周波数領域信号におけるビットを差し引き、ビットが割り当てられる最高周波数に割り当てられるビットとその近傍周波数領域信号をそれに応じて増大させてもよい。即ち、当該周波数領域信号に対するビット割当てを調節するステップが、当該周波数領域信号により多くのビットが割り当てられる周波数帯に割り当てられるビットの数を減らすステップと、ビットが割り当てられる最高周波数に割り当てられるビットとその近傍周波数領域信号の数を増加させるステップを含んでもよい。音声信号に対しては、より多くのビットが割り当てられる周波数帯は0乃至2kHzの低周波数帯である。以下では、例を用いて、当該周波数領域信号に対するビット割当ての調節を説明する。
調節例1では、ビットが割り当てられる最高周波数は4kHzである。2kHz乃至4kHzの範囲のサブバンドに0ビットが割り当てられる場合には、ビットが2kHz乃至4kHzの範囲の全てのサブバンドに割り当てられるまで当該周波数帯に5ビットが割り当てられる。2乃至4kHzの範囲でさらに追加されるビットの数がNbitであると仮定する。このケースでは、Nbit個のビットを0乃至2kHzの範囲のサブバンドから差し引く必要がある。例えば、使用されるアルゴリズムは、0乃至2kHzの範囲の全てのサブバンド(5個のサブバンド)内の各サブバンドから1ビットを差し引いて、当該最高周波数のサブバンドを取り除き、残りの4個のサブバンド内の各サブバンドから再度1ビットを差し引いて、2番目の最高周波数のサブバンドを再度取り除き、差し引かれたビットの数がNbitに等しくなるまで残りを類推により導くというものである。
調節例2では、2kHz乃至4kHzの範囲においてビットが割り当てられる全てのサブバンドにJビットを追加する。2乃至4kHzの範囲においてビットが割り当てられるサブバンドの数がKであると仮定する。このケースでは、2乃至4kHzの範囲でさらに追加されるビットの数NbitはJ×Kに等しく、Nbit=J×K個のビットを0乃至2kHzの範囲のサブバンドから差し引く必要がある。例えば、使用できるアルゴリズムは、Nbit/5個のビットが0乃至2kHzの範囲の全てのサブバンド(5個のサブバンド)の各サブバンドから平均して差し引かれるというものである。
調節例3では、2kHz乃至4kHの範囲においてビットが割り当てられない各サブバンドに5ビットが割り当てられ、Jビットが2乃至4kHzの範囲における全てのサブバンドに追加され、2乃至4kHzの範囲においてビットが割り当てられるサブバンドの数がKである場合、このケースでは、2乃至4kHzの範囲においてさらに追加されるビットの数Nbitは5×(5−K)+5×Jに等しく、Nbit個のビットを0乃至2kHzの範囲におけるサブバンドから差し引く必要がある。使用されるアルゴリズムは、調節例1でのアルゴリズムと調節例2でのアルゴリズムのうち何れか1つであってもよい。
さらに、ビットが割り当てられる周波数領域信号の最高周波数が所定値より小さい場合には、120で当該所定の割当て規則に従って実施される当該所定のビットの割当てが維持される。
140では、当該周波数領域信号を、調節したビット割当てに従って符号化する。実際には、要件に従って任意の周波数領域符号化方法を使用してもよい。選択した周波数領域符号化方法は本発明に対する限定を構成しない。
上述の信号符号化方法を用いることにより、周波数領域信号のビット割当てが、ビットが割り当てられる周波数領域信号の最高周波数に従って調節され、その結果、同数のビットを用いて周波数領域符号化を実施するときに良好な符号化効果が実現される。
上述の信号符号化方法を様々な符号化の解決策に適切に適用してもよく、以下では時間周波数結合符号化の方法の適用を例示的な説明のための1例として使用する。
図2は、本発明の1実施形態に従う時間周波数結合符号化方法200を示す。図2の220、230、および240はそれぞれ図1の120、130、および140と同じである。図2と図1の違いは、ステップ250およびステップ260が追加され、図1の110が211と212で置き換えられていることである。以下では図2と図1の違いを説明するが、その内容を再び一般的に説明することはしない。
211では、時間領域分析を入力信号に対して実施することによって第1の時間領域信号と第2の時間領域信号を取得する。例えば、線形予測符号化(LPC、linear predictive coding)分析と処理を当該入力信号に対して実施して、線スペクトル周波数(Line Spectral Frequency、LSF)パラメータとイミタンス・スペクトル周波数(Immittance Spectral Frequency、ISF)パラメータのうち1つを取得し、さらに、残差信号resと適応的コードブック寄与exc_pitを取得する。LSFパラメータまたはISFパラメータを使用して、LPC分析で使用される係数(即ち、LPC係数)の周波数領域特性を表現する。残差信号resと適応的コードブック寄与exc_pitは当該第1の時間領域信号に含まれ、適応的コードブック寄与exc_pitは当該第2の時間領域信号に含まれる。
212では、当該第1の時間領域信号で周波数領域変換を実施し処理することにより、周波数領域信号を取得する。1例として、周波数領域変換を当該第1の時間領域信号内の残差信号resと適応的コードブック寄与exc_pitに対して別々に実施し、周波数領域の残差信号f_resと周波数領域の適応的コードブック寄与f_exc_pitの関連性に従って、適応的コードブック寄与が出力信号に寄与するかどうかを判定する。適応的コードブック寄与が出力信号に寄与する場合には、当該周波数領域の適応的コードブック寄与f_exc_pitを当該周波数領域の残差信号f_resから差し引いて、当該周波数領域の差分信号f_diffを取得し、差分信号f_diffを当該周波数領域信号として使用する。当該適応的コードブック寄与が出力信号に寄与しない場合には、当該周波数領域の残差信号f_resを直接、差分信号f_diffとして、即ち当該周波数領域信号として使用する。
当該周波数領域信号を取得した後、当該周波数領域信号を図1の120、130、および140と同じである220、230、および240を用いて符号化して、符号化した周波数領域信号を取得する。
250では、第2の時間領域信号を符号化する。1例として、260を、当該周波数領域信号が符号化されたと同時に実施する。当該時間領域信号を、(予測符号化またはパルス符号変調(Pulse Code Modulation、PCM)符号化のような)任意の時間領域符号化方法を用いて符号化してもよく、使用される時間領域符号化方法は本発明に対する限定を構成しない。適応的コードブック寄与が出力信号に寄与するときには、当該適応的コードブック寄与を復号側で取得する必要があり、したがって、第2の時間領域信号における適応的コードブック寄与exc_pitが符号化され、その結果、ビット・ストリームとして受信側に送信される。しかし、適応的コードブック寄与が出力信号に寄与しない場合、即ち、復号側の出力が適応的コードブック寄与を必要としない場合には、時間領域符号化の部分は必要でなく、符号化効率が高まる。適応的コードブック寄与が出力信号に寄与するというのは、高品質な出力信号を符号化された周波数領域信号のみに従って復号側で取得できないことを意味する。
260では、符号化された周波数領域信号および符号化された第2の時間領域信号を当該ビット・ストリームに多重化する。
差分信号f_diffを含める以外に、周波数領域符号化を実施する必要がある周波数領域信号がさらに、適応的コードブック寄与が出力信号に寄与するかどうかを示すフラグflagのような別の信号を含んでもよいことに留意されたい。同様に、適応的コードブック寄与exc_pitを含める以外に、時間領域符号化を実施する必要がある第2の時間領域信号がさらに、復号化に必要な他の情報を含んでもよい。
図2を参照して説明した上述の時間周波数結合符号化では、周波数領域信号に対するビット割当てを、時間領域符号化と組み合わせて、ビットが割り当てられる周波数領域信号の最高周波数に従って調節する。その結果、良好な符号化効果が達成される。
図3は、本発明の1実施形態に従う信号復号化方法300を示す。方法300は以下を含む。
310では、受信したビット・ストリームから、復号化で得られた周波数領域信号を取得する。周波数領域符号化のみを使用するときには、周波数領域符号化方法に対応する周波数領域復号化方法を用いることによって、復号化で得られた周波数領域信号を受信したビット・ストリームから取得する。時間周波数結合符号化のケースでは、当該ビット・ストリーム内の周波数領域情報に対して周波数領域復号化を実施して第1の周波数領域信号を取得するステップと、当該第1の周波数領域信号に従って、出力信号に寄与する時間領域符号化信号が当該ビット・ストリームに存在するかどうかを判定するステップと、当該出力信号に寄与する時間領域符号化信号が当該ビット・ストリームに存在すると判定されたとき、当該時間領域符号化信号に対して時間領域復号化と周波数領域変換を実施して第2の周波数領域信号を取得し、当該第1の周波数領域信号と当該第2の周波数領域信号を合成して、復号化で得られた周波数領域信号を取得するステップを実施することによって、復号化で得られた周波数領域信号を受信したビット・ストリームから取得する。これについては図4を参照して下記でさらに詳細に説明する。
320では、復号化で得られた周波数領域信号が所定条件を満たすとき、復号化で得られた周波数領域信号に従って、復号化で得られなかった周波数領域信号を予測する。1例として、復号化で得られた周波数領域信号が所定条件を満たすことは、復号化で得られた周波数領域信号の最高周波数が所定値より大きいこと、および、復号化で得られた周波数領域信号が、周波数領域変換が実施され出力信号に寄与する時間領域符号化信号を含むこと、のうち少なくとも1つを含む。実際には、復号化で得られた周波数領域信号が、周波数領域変換が実施され出力信号に寄与する時間領域符号化信号を含むという判定条件を最初に適用し、次に、復号化で得られた周波数領域信号の最高周波数が所定値より大きいという判定条件を適用してもよく、または、逆の順序が使用され、これらの2つのうち1つのみを使用してもよいことに留意されたい。
上述のように図1の130を参照すると、当該所定値は周波数領域符号化に使用されるtot_bit個の所定のビットと当該周波数領域信号の解像度とに従って決定される。実施要件に従って、当該所定値を、当該周波数領域信号の最高周波数の値よりも小さい特定の周波数である周波数値に設定してもよい。当該周波数領域信号をサブバンドに分割するとき、当該所定値がサブバンドのインデックス番号であってもよく、ビットが割り当てられる周波数領域信号の最高周波数は、当該最高周波数領域が位置するサブバンドのインデックス番号を用いることによって表される。復号側での当該所定値は、符号化側の当該所定値と同じであっても異なってもよい。
時間周波数結合符号化のケースでは、復号化で得られた周波数領域信号は、310での復号化当該ビット・ストリームにより得られ、周波数領域変換が実施され出力信号に寄与する時間領域符号化信号、および、周波数領域変換が実施され出力信号に寄与する時間領域符号化信号を含む可能性があり、例えば、適応的コードブック寄与のような、当該ビット・ストリームに含まれる時間領域符号化情報に対して時間領域復号化および周波数領域変換を実施することによって得られる信号である。様々な種類の符号化された信号に従って、符号化の最中に使用される時間領域分析方法がLPC分析でないときには、周波数領域変換が実施され出力信号に寄与する時間領域符号化信号が当該適応的コードブック寄与を除いて別の信号であってもよい。
復号化で得られた周波数領域信号が適応的コードブック寄与を含むときには、上述の適応的コードブック寄与が出力信号に寄与するかどうかを示すフラグflagに従って、復号化で得られた周波数領域信号が、周波数領域変換が実施され出力信号に寄与する時間領域符号化信号を含むかどうかを学習してもよい。復号化で得られた周波数領域信号が、周波数領域変換が実施され出力信号に寄与する時間領域符号化信号を含み、これは、周波数領域復号化のみを利用するのでは高品質な出力を得ることが難しいことを示し、会話/音声信号の特徴によれば、このケースでは、復号化で得られなかった周波数領域信号を単純に雑音に設定すると出力信号の品質が悪化する。その結果、復号化で得られなかった
周波数領域信号を予測する必要がある。
復号化で得られた周波数領域信号に従って、復号化で得られなかった周波数領域信号を予測する1例として、復号化で得られた周波数領域信号の最高周波数から低周波数までの周波数帯の周波数領域信号を選択してもよく、復号化で得られなかった周波数領域信号を当該選択した周波数領域信号に従って予測してもよい。例えば、フレーム長が20msであり標本化速度が12.8kHzである信号に対して、256個の周波数領域係数が存在し、帯域幅は6.4kHzである。符号化率が7.6kbpsである、即ち、16個の係数ごとに1つのサブバンドがあるときには、全部で16個のサブバンドが存在し、当該所定値は10(4kHz)に設定される。復号化で得られた周波数領域信号の最高周波数帯が10より大きいとき、4乃至6.4kHzの範囲での復号化によっては得られない周波数領域係数を、1.6乃至4kHzの範囲での復号化によって得られる周波数領域係数を用いることによって予測を通じて取得する。当該予測の実装の1例として、復号化で得られなかった周波数領域信号を、正常化処理、エンベロープ処理等を選択した周波数領域信号に対して実施することによって予測してもよい。当該正常化処理とエンベロープ処理の実装は、当業者に公知な手段であり、ここでは詳細には説明しない。さらに、出力信号のタイプに従って、当業者は、別の方式を選択することによって、復号化で得られなかった周波数領域信号を予測してもよく、例えば、復号化で得られた周波数領域信号内の固定周波数帯における周波数領域信号に従って、復号化で得られなかった周波数領域信号を予測してもよい。
復号化で得られなかった周波数領域信号を復号化で得られた周波数領域信号に従って取得した後に、復号化によって得られなかった予測された周波数領域係数を、符号化側からのISFパラメータまたはLSFパラメータを用いることによって補正して、当該予測した周波数領域信号が過度なエネルギを有する周波数チャネル番号を含むのを防ぐことができることに留意されたい。例えば、当該LSFパラメータまたはISFパラメータを用いることによって共鳴ピーク位置を推定し、それぞれの推定された共鳴ピーク位置で、大きな振幅を有する周波数領域係数を拡大する。1例として、当該共鳴位置付近の予測された周波数領域係数の振幅が閾値より大きい(当該閾値を、符号化側の時間領域分析の特性に従って設定してもよい)ときには、当該共鳴位置付近の予測された周波数領域係数の振幅を減らす。
さらに、周波数領域信号が所定条件を満たさないときには、雑音を用いて、復号化で得られなかった周波数領域信号を予測する。
330では、復号化で得られた周波数領域信号と予測した周波数領域信号に従って、最終的に出力される時間領域信号を取得する。復号化で得られた周波数領域信号を復号化によって取得し、復号化で得られなかった周波数領域信号を予測して、全体の周波数帯における周波数領域信号を取得し、時間領域内の出力信号を、周波数領域逆変換、例えば、逆高速フーリエ変換(IFFT、Inverse Fast Fourier Transform)のような処理を行うことによって取得する。1例として、時間周波数結合符号化のケースでは、LPC係数は、変換を当該ISFパラメータまたはLSFパラメータに対して実施することによって得られ、当該LPC係数を用いることによって、周波数領域逆変換の後に取得される信号に対して時間領域合成を実施して最終的に出力される時間領域信号を取得する。実際には、周波数領域信号に従って時間領域内の出力信号をどのように取得するかについては当業者には公知であり、ここでは詳細には説明しない。
図3を参照して説明した本発明の当該実施形態に従う上述の信号復号化方法では、復号化で得られなかった周波数領域信号は復号化で得られた周波数領域信号の誘導のもとで設定され、出力信号の良好な効果が達成される。
本発明の当該実施形態を当業者に対してより良く開示するために、以下では図4を参照して、時間周波数結合復号化の解決策における本発明の当該実施形態に従う復号化方法の適用を説明する。当該時間周波数結合復号化の解決策では、受信したビット・ストリームから、復号化で得られた周波数領域信号を取得するステップ(310)を除いて、後続の動作は図3を参照して説明した320と330と同じである。したがって、以下では、時間周波数結合復号化方法において、復号化で得られた周波数領域信号をどのように取得するかについてのみ説明する。
図4は、受信したビット・ストリームから時間周波数結合復号化方法における復号化で得られた周波数領域信号を取得するための方法410を示す。方法410は以下を含む。
411では、ビット・ストリームを第1の1群のビットと第2の1群のビットに逆多重化する。受信側での復号化の最中には、当該ビット・ストリームを受信したとき、当該ビット・ストリームが、図2の260における多重化技術に対応する逆多重化技術を用いることによって第1の1群のビットと第2の1群のビットに逆多重化される。当該第1の1群のビットは、後続の周波数領域復号化を実施する必要がある周波数領域情報を含み、第2の1群のビットは、後続の時間領域符号化を実施する必要があり出力信号に寄与する時間領域符号化信号を含む。
音声信号の時間領域結合復号化に関して、当該第1の1群のビットは、例えば、差分信号f_diff、適応的コードブック寄与が出力信号に寄与するかどうかを示すフラグflag等を含む。当該第2の1群のビットは、例えば、当該適応的コードブック寄与が出力信号に寄与するときの当該適応的コードブック寄与を含む。当該第1の1群のビットおよび当該第2の1群のビットおよび信号をエンコードするとき、別の信号をさらにそれに応じてエンコードしてもよいことに留意されたい。
412では、周波数領域復号化を第1の1群のビットに対して実施して第1の周波数領域信号を取得し、当該第1の周波数領域信号に従って、当該出力信号に寄与する時間領域符号化信号が当該ビット・ストリームに存在するかどうかを判定する。当該第1の1群のビットは、符号化側で周波数領域符号化方法に対応する復号化方法を用いて復号化して、当該第1の周波数領域信号を得る。当該第1の周波数領域信号は、例えば、復号化差分信号f_diff、および、適応的コードブック寄与が出力信号に寄与するかどうかを示すフラグflagを含む。
413では、時間領域復号化を第2の1群のビットに対して実施する。当該第2の1群のビットを、符号化側での時間領域符号化方法に対応する復号化方法を用いることによって復号化して、復号化時間領域信号を取得する。特に、当該出力信号に寄与する時間領域符号化信号が当該ビット・ストリームに存在すると判定されたとき、時間領域復号化を当該第2の1群のビットにおける時間領域符号化信号に対して実施する。
414では、周波数領域変換を復号化時間領域信号における適応的コードブック寄与に対して実施して、第2の周波数領域信号を取得する。
415では、当該第1の周波数領域信号および当該第2の周波数領域信号を合成して、復号化で得られた周波数領域信号を取得する。1例として、当該適応的コードブック寄与が出力信号に寄与するときには、当該周波数領域信号を、当該第1の周波数領域信号における差分信号f_diffと当該第2の周波数領域信号における当該適応的コードブック寄与とを加算することによって合成により取得する。当該適応的コードブック寄与が出力信号に寄与しないときには、当該第1の周波数領域信号における差分信号f_diffを直接当該周波数領域信号として使用する。
復号化で得られた周波数領域信号を取得した後、最終的に出力される時間領域信号を、図3の320および330と同じステップを用いることによって取得する。
上述の方法の実施形態に関連して、本発明はさらに符号化装置と復号化装置を提供する。当該符号化装置または復号化装置を端末装置、ネットワーク装置、または試験装置に配置してもよい。当該符号化装置または復号化装置を、ハードウェア回路によって実装してもよく、または、ハードウェアと協働するソフトウェアにより実装してもよい。
図5は、本発明に従う符号化装置および/または復号化装置の例示的な実装形態を示す。図5に示すように、プロセッサ510は入出力インタフェース520を用いることにより符号化装置または復号化装置530を起動し、メモリ540の支援により音声信号の符号化処理または復号化処理を実装する。符号化装置または復号化装置530が、上述の方法の実施形態における様々な方法や手続きを実施してもよい。
図6は、本発明の1実施形態に従う信号符号化のための符号化装置600を示す。符号化装置600は、入力信号に従って周波数領域信号を取得する周波数領域変換ユニット610と、所定の割当て規則に従って所定のビットを当該周波数領域信号に割り当てるビット割当てユニット620と、ビットが割り当てられる周波数領域信号の最高周波数が所定値以上であるとき、当該周波数領域信号に対するビット割当てを調節するビット調整ユニット630と、調節された当該ビット割当てに従って当該周波数領域信号を符号化する周波数領域符号化ユニット640とを備える。
周波数領域変換ユニット610は、入力信号に従って周波数領域信号を取得してもよい。当該入力信号が、画像信号、データ信号、音声信号、ビデオ信号、またはテキスト信号のような様々な種類の信号であってもよい。周波数領域変換を、FFTまたはDCTのようなアルゴリズムを用いることによって入力信号で実施して当該周波数領域信号を取得してもよい。入力信号および周波数領域変換アルゴリズムの種類は本発明に対する限定を構成しない。
ビット割当てユニット620は、所定の割当て規則に従って所定数tot_bitのビットを当該周波数領域信号に割り当ててもよい。tot_bitは、当該周波数領域信号での符号化を実施するために使用する必要があるビットの数である。当該所定の割当て規則が、例えば、当該所定のビットにおけるより多くのビットが当該周波数領域信号における低周波数帯信号に割り当てられ、当該所定のビットにおける残りのビットが、当該低周波数帯信号を除いてより大きなエネルギの周波数帯に割り当てられるというものであってもよい。低周波数帯における周波数領域信号の割当てに関して、より多くのビットを全ての低周波数帯に対する低周波数帯信号に対して均一に割り当ててもよく、または、より多くのビットを当該低周波数帯信号のエネルギ分布に従って当該低周波数帯信号に割り当ててもよい。より多くのビットを当該低周波数帯信号に割り当てる理由は、周波数領域では、会話のような音声信号は主に低周波数範囲に集中し、より多くのビットを音声信号に割り当てることによって周波数領域符号化の効率を高めることができるからである。
1例として、周波数領域符号化を音声信号に実施する例示的なケースでは、図1の120を参照して上述したように、0乃至4kHzの周波数範囲における周波数領域信号を10個のサブバンドに分割する。0乃至2kHzの周波数範囲には5個のサブバンドがあり、2乃至4kHzの周波数範囲には5個のサブバンドがある。次いで、ビット割当てをサブバンドごとに実施する。量が1F_bitであるより多くのビットが0乃至2kHzの周波数範囲の低周波数領域信号に割り当てられる。(1F_bitをtot_bitから引いた)残りのビットrest_bitは、2乃至4kHzの周波数範囲の各サブバンドのエンベロープに従って2乃至4kHzの周波数範囲のサブバンドに割り当てられる。特に、ビットが割り当てられるサブバンドとビットが割り当てられる最高周波数帯のサブバンドlast_binの数が、rest_bitおよび各サブバンドのエンベロープのサイズに従って決定され、同時に、5でぴったり除すことができない残りを0乃至2kHzの範囲の各サブバンドに均等に割り当てる。
ビット調整ユニット630は、ビットが割り当てられる周波数領域信号の最高周波数が所定値B以上であるとき、当該周波数領域信号に対するビット割当てを調節してもよい。所定値Bは、所定のビットのビット数tot_bitと当該周波数領域信号の解像度(例えば、4kHz)に従って決定される。当該所定値は、事前設定された上限周波数の値である。具体的な実施においては、所定値Bを、当該周波数領域信号の最高周波数の値(例えば、4kHz)より小さい特定の周波数である周波数値、例えば2.9kHz、3.2kHz、3.5kHz等に設定してもよい。上述のように、当該周波数領域信号を符号化のためにサブバンドに分割するときには、所定値Bは、0乃至4kHzの周波数範囲の10個のサブバンドのインデックス番号(例えば、7または8)であってもよく、同時に、ビットが割り当てられる周波数領域信号の最高周波数を、当該最高周波数が位置するサブバンドのインデックス番号indexを用いることによって表してもよい。
ビットが割り当てられる周波数領域信号の最高周波数(例えば、index=7)が所定値(例えば、B=8)より小さい場合には、ビット割当てユニット620において所定の割当て規則に従って実施される当該所定のビットの割当てを維持する。
当該最高周波数が当該所定値以上であるとき、ビット調整ユニット630は、ビット割当てユニット620によって所定の割当て規則に従って実施される周波数領域信号に対するビット割当てを調節してもよい。入力信号の種類、当該周波数領域信号の周波数領域特性等に従って、当該周波数領域信号における復号側での出力にあまり寄与しない部分を取り除き、ビットが割り当てられる最高周波数に割り当てられるビットおよびその近傍周波数領域信号をそれに応じて増大させてもよい。1例として、ビット調整ユニット630が、当該周波数領域信号においてより多くのビットが割り当てられる周波数帯に割り当てられるビットの数を減らし、ビットが割り当てられる最高周波数に割り当てられるビットとその近傍周波数領域信号の数を増やしてもよい。音声信号に対しては、より多くのビットが割り当てられる周波数帯は0乃至2kHzの低周波数帯である。
当該周波数領域信号に対するビット割当てを調節するステップの実装については、上述の調節例1乃至3を参照することができ、ここでは再び詳細に説明することはしない。
周波数領域符号化ユニット640は、調節したビット割当てに従って周波数領域信号を符号化する。当該周波数領域信号を符号化するための方法が、例えば、変換符号化、サブバンド符号化等であってもよい。さらに、上記最高周波数が上記所定値を下回るとき、ビット調整ユニット630は当該周波数領域信号に対するビット割当てを調節しない。このケースでは、当該周波数領域信号に対するビット割当ては所定のビット割当て規則に従って実施されたビット割当てであり、周波数領域符号化ユニット640は、当該所定のビット割当て規則に従って実施したビット割当てに従って当該周波数領域信号を符号化する。
信号符号化のための上述の装置600では、周波数領域信号に対するビット割当ては、ビットが割り当てられる周波数領域信号の最高周波数に従って調節され、その結果、
良好な符号化効果が達成される。
符号化装置600を、様々な符号化技術に適切に適用してもよく、以下では、時間周波数結合符号化における装置の適用を例示的な説明のための1例として使用する。
図7は、本発明の1実施形態における符号化装置を用いた時間周波数結合符号化装置700を示す。
時間周波数結合符号化装置700は、時間領域分析を入力信号に対して実施することによって第1の時間領域信号と第2の時間領域信号を取得する時間領域分析ユニット711と、当該第1の時間領域信号で周波数領域変換を実施し処理することによって周波数領域信号を取得する周波数領域変換ユニット712と、所定の割当て規則に従って所定のビットを当該周波数領域信号に割り当てるビット割当てユニット720と、ビットが割り当てられる周波数領域信号の最高周波数が所定値以上であるとき、当該周波数領域信号に対するビット割当てを調節するビット調整ユニット730と、調節したビット割当てに従って当該周波数領域信号を符号化する周波数領域符号化ユニット740と、当該第2の時間領域信号を符号化する時間領域符号化ユニット750と、符号化した周波数領域信号と符号化した第2の時間領域信号をビット・ストリームに多重化するビット多重化ユニット760とを備える。
図7のビット割当てユニット720、ビット調整ユニット730、および周波数領域符号化ユニット740はそれぞれ、図6のビット割当てユニット620、ビット調整ユニット630、および周波数領域符号化ユニット640と同じである。図7および図6の違いは、時間領域符号化ユニット750とビット多重化ユニット760が追加され、図6の周波数領域変換ユニット610が時間領域分析ユニット711と周波数領域変換ユニット712で置き換えられていることである。以下では図7と図6の違いを説明するが、その内容を再び一般的に説明することはしない。
時間領域分析ユニット711は、時間領域分析を入力信号に対して実施することによって第1の時間領域信号と第2の時間領域信号を取得する。例えば、LPC分析および処理を当該入力信号に対して実施して、ISFパラメータ(またはLSFパラメータ)、残差信号res、および適応的コードブック寄与exc_pitを取得する。残差信号resおよび適応的コードブック寄与exc_pitは当該第1の時間領域信号として使用され、適応的コードブック寄与exc_pitは第2の時間領域信号として使用される。
周波数領域変換ユニット712は、周波数領域変換および処理を当該第1の時間領域信号に対して実施することによって、周波数領域信号を取得してもよい。1例として、周波数領域変換が当該第1の時間領域信号における残差信号resおよび適応的コードブック寄与exc_pitに対して別々に実施され、次いで、周波数領域の残差信号f_resと周波数領域の適応的コードブック寄与f_exc_pitの関連性に従って、当該適応的コードブック寄与が出力信号に寄与するかどうかを判定する。当該適応的コードブック寄与が出力信号に寄与する場合には、当該周波数領域の適応的コードブック寄与f_exc_pitを当該周波数領域の残差信号f_resから差し引いて当該周波数領域の差分信号f_diffを取得し、差分信号f_diffを当該周波数領域信号に含める。当該適応的コードブック寄与が出力信号に寄与しない場合には、当該周波数領域の残差信号f_resを直接差分信号f_diffとして使用し、当該周波数領域信号として送信する。差分信号f_diffを含めること以外に、当該周波数領域信号がさらに別の信号、例えば、当該適応的コードブック寄与が出力信号に寄与するかどうかを示すフラグflagを含んでもよい。
当該周波数領域信号を取得した後、図7のビット割当てユニット720、ビット調整ユニット730、および周波数領域符号化ユニット740を用いて当該周波数領域信号を符号化して、符号化された周波数領域信号を取得する。
時間領域符号化ユニット750が上記第2の時間領域信号を符号化してもよい。当該時間領域信号を、予測符号化またはパルス符号変調のような時間領域符号化方法を用いて符号化してもよい。適応的コードブック寄与が出力信号に寄与するときには、当該適応的コードブック寄与を復号側で取得する必要があり、したがって、当該第2の時間領域信号における適応的コードブック寄与exc_pitを符号化し、受信側に送信されるようにする。しかし、当該適応的コードブック寄与が出力信号に寄与しない場合には、当該適応的コードブック寄与を符号化も送信もする必要がなく、符号化効率が高まる。ビット多重化ユニット760が符号化された周波数領域信号と符号化された第2の時間領域信号をビット・ストリームに多重化してもよい。
図7を参照して説明した上述の時間周波数結合符号化装置では、周波数領域信号に対するビット割当てを、ビットが割り当てられる周波数領域信号の最高周波数に従って調節する。これは時間領域符号化で結合され、その結果、良好な符号化効果が達成される。
図8は、本発明の1実施形態に従う信号復号化のための復号化装置800を示す。復号化装置800は、受信したビット・ストリームから、復号化で得られた周波数領域信号を取得する復号化ユニット810と、復号化で得られなかった周波数領域信号を予測し、復号化で得られた周波数領域信号が所定条件を満たすとき、復号化で得られた周波数領域信号に従って、復号化で得られなかった周波数領域信号を予測するように構成された帯域幅拡張ユニット820と、復号化で得られた周波数領域信号と当該予測した周波数領域信号に従って、最終的に出力される時間領域信号を取得する出力ユニット830とを備える。
復号化ユニット810は、受信したビット・ストリームから、復号化で得られた周波数領域信号を取得してもよい。周波数領域符号化のみを使用するときには、周波数領域符号化方法に対応する周波数領域復号化方法を用いることによって、復号化で得られた周波数領域信号を受信したビット・ストリームから取得する。時間周波数結合符号化のケースでは、復号化ユニット810が、当該ビット・ストリーム内の周波数領域情報に対して周波数領域復号化を実施して第1の周波数領域信号を取得するステップと、当該第1の周波数領域信号に従って、出力信号に寄与する時間領域符号化信号が当該ビット・ストリームに存在するかどうかを判定するステップと、当該出力信号に寄与する時間領域符号化信号が当該ビット・ストリームに存在すると判定されたとき、当該時間領域符号化信号に対して時間領域復号化と周波数領域変換を実施して第2の周波数領域信号を取得し、当該第1の周波数領域信号と当該第2の周波数領域信号を合成して復号化で得られた周波数領域信号を取得するステップとを実施することによって、受信したビット・ストリームから復号化で得られた周波数領域信号を取得してもよい。これについては図9を参照して以下で詳細に説明する。
帯域幅拡張ユニット820を、復号化で得られなかった周波数領域信号を予測ように構成してもよい。復号化で得られた周波数領域信号が当該所定条件を満たすときには、帯域幅拡張ユニット820は復号化で得られた周波数領域信号に従って、復号化で得られなかった周波数領域信号を予測してもよい。1例として、復号化で得られた周波数領域信号が所定条件を満たすことは、復号化で得られた周波数領域信号の最高周波数が所定値より大きいこと、および、復号化で得られた周波数領域信号が、周波数領域変換が実施され出力信号に寄与する時間領域符号化信号を含むことのうち少なくとも1つを含む。実際には、必要に応じて選択を行ってもよい。
上述のように、当該所定値を、周波数領域符号化に使用されるtot_bit個の所定のビットおよび周波数領域信号の解像度に従って決定してもよい。実際の必要に従って、当該所定値を、当該周波数領域信号の最高周波数の値より小さい特定の周波数である周波数値に設定してもよい。当該周波数領域信号をサブバンドに分割するとき、当該所定値はサブバンドのインデックス番号であってもよく、ビットが割り当てられる周波数領域信号の最高周波数は、当該最高周波数領域が位置するサブバンドのインデックス番号を用いることによって表される。
時間周波数結合復号化技術を使用するときには、復号化で得られた周波数領域信号は、当該ビット・ストリームを復号化することにより復号化ユニット810で取得され、当該ビット・ストリームに含まれる時間領域情報、例えば、適応的コードブック寄与に対して当該時間領域復号化および周波数領域変換を実施することによって得られる信号を含む可能性がある。上述の適応的コードブック寄与が出力信号に寄与するかどうかを示すフラグflagに従って、周波数領域変換が実施され出力信号に寄与する時間領域符号化信号を当該周波数領域信号が含むかどうかを学習してもよい。様々な種類の符号化された信号に従って、符号化の最中に使用される時間領域分析方法がLPC分析でないときには、周波数領域変換が実施され出力信号に寄与する時間領域符号化信号が別の信号であってもよい。
復号化で得られた周波数領域信号は、当該ビット・ストリームに含まれる時間領域信号に対して時間領域復号化および周波数領域変換を実施することによって得られる信号を含み、これは、復号化で得られなかった周波数領域信号が、出力に対して有用である信号を含むことを示し、その結果、復号化で得られなかった周波数領域信号を予測する必要があり、復号化で得られなかった周波数領域信号を単純に雑音に設定すると出力信号の品質が悪化する。
さらに、復号化で得られた周波数領域信号が所定条件を満たさないときには、帯域幅拡張ユニット820は、復号化で得られなかった周波数領域信号を雑音に設定してもよい。
復号化で得られた周波数領域信号に従って、復号化で得られなかった周波数領域信号を予測する1例として、帯域幅拡張ユニット820は、復号化で得られた周波数領域信号の最高周波数から低周波数までの周波数帯から周波数領域信号を選択し、選択した周波数領域信号を上述のように処理して、当該選択した周波数領域信号に従って、復号化で得られなかった周波数領域信号を予測してもよい。さらに、復号化で得られなかった周波数領域信号を、別の方式を用いることによって予測してもよく、例えば、復号化で得られなかった周波数領域信号を、復号化で得られた周波数領域信号内の固定周波数帯における周波数領域信号に従って予測してもよい。
出力ユニット830は、復号化で得られた周波数領域信号と当該予測した周波数領域信号に従って、最終的に出力される時間領域信号を取得してもよい。復号化で得られなかった周波数領域信号を予測した後、全体の周波数帯における周波数領域信号を取得し、符号化の間に使用される周波数領域変換の逆変換を用いることによって、周波数領域逆変換を全体の帯域幅における周波数領域信号に対して実施し、時間領域内の出力信号を取得する。上述のように、当該出力ユニットは、ISFパラメータ(またはLSFパラメータ)に従って得られたLPC係数を用いることによって、周波数領域逆変換後の信号に対して時間領域合成を実施して、出力するための最終的に出力される時間領域信号を取得してもよい。
復号化装置800のユニットのより詳細な動作については、図3を参照して説明した上述のステップを参照されたい。
図8を参照して説明した、本発明の当該実施形態に従う信号復号化のための上述の復号化装置800では、復号化で得られなかった周波数領域信号を復号化で得られた周波数領域信号の誘導のもとで設定し、出力信号がより良好な効果を達成するようにする。
本発明の当該実施形態を当業者に対してより良く開示するために、以下では時間周波数結合復号化の解決策における本発明の当該実施形態に従う復号化装置の適用を簡単に説明する。当該時間周波数結合復号化の解決策では、復号化ユニット810の動作を除いては、他の構成ユニットの動作は帯域幅拡張ユニット820および出力ユニット830の動作と同じである。したがって、以下では時間周波数結合復号化方法における復号化ユニット810の具体的な実装のみを説明する。
図9は、時間周波数結合復号化における復号化ユニット910のブロック図を示す。復号化ユニット910は、ビット・ストリームを第1の1群のビットと第2の1群のビットに逆多重化する逆多重化ユニット911と、周波数領域復号化を当該第1の1群のビットに対して行って第1の周波数領域信号を取得し、当該第1の周波数領域信号に従って、出力信号に寄与する時間領域符号化信号が当該ビット・ストリームに存在するかどうかを判定する周波数領域復号化ユニット912と、当該出力信号に寄与する時間領域符号化信号が当該ビット・ストリームに存在すると判定された場合には時間領域符復号化を第2の1群のビットにおいて実施する時間領域復号化ユニット913と、周波数領域変換を復号化時間領域信号に対して実施して第2の周波数領域信号を取得する周波数領域変換ユニット914と、当該第1の周波数領域信号および当該第2の周波数領域信号を合成して復号化で得られた周波数領域信号を取得する合成ユニット915と、を備える。
便宜上および説明の簡単さのため、逆多重化ユニット911、周波数領域復号化ユニット912、時間領域復号化ユニット913、周波数領域変換ユニット914、または合成ユニット915の具体的な動作については、図4の411、412、413、414、および415を参照されたい。ここでは再び詳細に説明することはしない。
本明細書で開示した諸実施形態で説明した例と組み合わせて、ユニットおよびアルゴリズムのステップを、電子ハードウェアまたはコンピュータ・ソフトウェアと電子ハードウェアの組合せにより実装してもよいことは当業者には理解される。機能をハードウェアで実装するかソフトウェアで実装するかは、具体的な適用と当該技術的解決策の設計制約条件に依存する。当業者は、様々な方法を使用して、具体的な適用ごとに説明した機能を実装できるが、当該実装が本発明の範囲を超えるものとみなすべきではない。
本願で提供した幾つかの実施形態では、開示した装置と方法を他の方式で実装してもよいことは理解される。例えば、説明した装置の実施形態は例示的なものにすぎない。例えば、ユニットの分割は論理的な機能分割にすぎず、実際の実装では他の分割であってもよい。例えば、複数のユニットもしくはコンポーネントを別のシステムに結合もしくは統合してもよく、または、一部の機能を無視するかもしくは実装しなくともよい。
別々の部分として説明したユニットが物理的に分離していてもしていなくてもよく、1カ所に配置されていてもよく、または、複数のネットワーク要素に分散してもよい。当該ユニットの一部または全部を必要に応じて選択して、諸実施形態の解決策の目的を達成してもよい。
さらに、本発明の諸実施形態の機能ユニットを1つの処理ユニットに統合してもよく、または、当該ユニットの各々が物理的に単体で存在してもよく、または、2つ以上のユニットを1つのユニットに統合してもよい。
機能をソフトウェアの機能ユニットの形で実装し、独立な製品として販売または使用するときには、当該機能をコンピュータ可読記憶媒体に格納してもよい。かかる理解のもとに、本発明の技術的解決策を本質的に、または、先行技術に寄与する部分、もしくは、当該技術的解決策の一部を、ソフトウェア製品の形で実装してもよい。当該コンピュータ・ソフトウェア製品は記憶媒体に格納され、コンピュータ装置(パーソナル・コンピュータ、サーバ、ネットワーク装置、等であってもよい)に本発明の諸実施形態で説明した方法のステップの全部または一部を実施するように指示するための幾つかの命令を含む。上述の記憶媒体には、USBフラッシュ・ドライブ、取外し可能ハード・ディスク、読取り専用メモリ(ROM、Read−Only Memory)、ランダム・アクセス・メモリ(RAM、Rおよびom Access Memory)、磁気ディスク、または光ディスクのような、プログラム・コードを格納できる任意の媒体が含まれる。
上述の説明は本発明の具体的な実装方式にすぎず、本発明の保護範囲を限定しようとするものではない。本発明で開示した技術的範囲において当業者が容易に想到する任意の変形または置換は本発明の保護範囲に入るものとする。したがって、本発明の保護範囲は特許請求の範囲の保護範囲の支配を受けるものとする。
510 プロセッサ
520 入出力インタフェース
530 符号化装置/復号化装置
540 メモリ
600 装置
610 周波数領域変換ユニット
620 ビット割当てユニット
630 ビット調整ユニット
640 周波数領域符号化ユニット
700 装置
711 時間領域分析
712 周波数領域変換ユニット
720 ビット割当てユニット
730 ビット調整ユニット
740 周波数領域符号化ユニット
750 時間領域符号化
760 ビット多重化
800 装置
810 復号化ユニット
820 拡張ユニット
830 出力ユニット
910 復号化ユニット
911 逆多重化ユニット
912 周波数領域復号化ユニット
913 時間領域復号化ユニット
914 周波数領域変換ユニット
915 合成ユニット

Claims (13)

  1. 受信したビット・ストリームから、復号化れた周波数領域信号を取得するステップと、
    復号化された周波数領域信号が所定条件を満たすとき、前復号化された周波数領域信号に従って、予測される周波数領域信号を予測するステップと、
    復号化された周波数領域信号と前記予測した周波数領域信号に従って、時間領域信号を取得するステップと、
    を含み、
    前記所定条件は、
    前記復号化された周波数領域信号の最高周波数が所定値より大きいこと、
    前記復号化された周波数領域信号が、周波数領域変換が実施され出力信号に寄与する時間領域符号化信号を含むこと、
    の条件のうち少なくとも1つを含む、信号復号化方法。
  2. 受信したビット・ストリームから、復号化で得られた周波数領域信号を取得するステップは、
    前記ビット・ストリーム内の周波数領域情報に対して周波数領域復号化を実施して第1の周波数領域信号を取得するステップと、
    前記第1の周波数領域信号に従って、前記出力信号に寄与する時間領域符号化信号が前記ビット・ストリームに存在するかどうかを判定するステップと、
    前記出力信号に寄与する時間領域符号化信号が前記ビット・ストリームに存在すると判定されたとき、前記時間領域符号化信号に対して時間領域復号化と周波数領域変換を実施して第2の周波数領域信号を取得し、前記第1の周波数領域信号と前記第2の周波数領域信号を合成して復号化で得られた前記周波数領域信号を取得するステップと、
    を含む、請求項に記載の方法。
  3. 前記所定値は、周波数領域符号化に使用される所定のビットの数と復号化で得られた前記周波数領域信号の解像度とに従って決定される、請求項1に記載の方法。
  4. 復号化された周波数領域信号に従って、予測される周波数領域信号を予測するステップは、周波数帯における周波数領域信号を前復号化された周波数領域信号から選択し、前記選択した周波数領域信号に従って、前予測される周波数領域信号を予測するステップを含む、請求項1〜のいずれか一項に記載の方法。
  5. 前記予測される周波数領域信号を予測した後前記方法は、前記予測される周波数領域信号の共鳴ピーク位置を線スペクトル周波数(LSF)またはイミタンス・スペクトル周波数(ISF)に従って推定し、前記共鳴ピーク位置付近の予測された周波数領域係数の振幅が閾値より大きいときには、前記共鳴ピーク位置付近の予測された周波数領域係数の前記振幅を減らすステップをさらに含む、請求項1〜のいずれか一項に記載の方法。
  6. 復号化された周波数領域信号が前記所定条件を満たさないときには、雑音を用いて、予測される周波数領域信号を予測する、請求項1〜のいずれか一項に記載の方法。
  7. 受信したビット・ストリームから、復号化された周波数領域信号を取得するように構成された復号化ユニットと、
    復号化された周波数領域信号に従って、前復号化された周波数領域信号が所定条件を満たすとき、予測される周波数領域信号を予測するように構成された帯域幅拡張ユニットと、
    復号化された周波数領域信号と前記予測した周波数領域信号に従って、時間領域信号を取得するように構成された出力ユニットと、
    を備え、
    前記所定条件は、前記復号化された周波数領域信号の最高周波数が所定値より大きいこと、および、前記復号化された周波数領域信号が、周波数領域変換が実施され出力信号に寄与する時間領域符号化信号を含むことのうち少なくとも1つを含む、信号復号化装置
  8. 前記復号化ユニットは、
    前記ビット・ストリーム内の周波数領域情報に対して周波数領域復号化を実施して第1の周波数領域信号を取得するステップと、
    前記第1の周波数領域信号に従って、前記出力信号に寄与する時間領域符号化信号が前記ビット・ストリームに存在するかどうかを判定するステップと、
    前記出力信号に寄与する時間領域符号化信号が前記ビット・ストリームに存在すると判定されたとき、前記時間領域符号化信号に対して時間領域復号化と周波数領域変換を実施して第2の周波数領域信号を取得し、前記第1の周波数領域信号と前記第2の周波数領域信号を合成して復号化で得られた前記周波数領域信号を取得するステップと、
    の動作を実施することにより、前記受信したビット・ストリームから、復号化で得られた前記周波数領域信号を取得する、請求項に記載の装置。
  9. 前記所定値は、周波数領域符号化に使用される所定のビットの数と復号化で得られた前記周波数領域信号の解像度とに従って決まる、請求項に記載の装置。
  10. 復号化された周波数領域信号が前記所定条件を満たすとき、前記帯域幅拡張ユニットは周波数帯における周波数領域信号を前復号化された周波数領域信号から選択し、前記選択した周波数領域信号に従って、前予測される周波数領域信号を予測する、請求項のいずれか一項に記載の装置。
  11. 復号化された周波数領域信号に従って、前予測される周波数領域信号を予測した後、前記帯域幅拡張ユニットは前記予測される周波数領域信号の共鳴ピーク位置を線スペクトル周波数(LSF)またはイミタンス・スペクトル周波数(ISF)に従って推定し、前記共鳴ピーク位置付近の予測された周波数領域係数の振幅が閾値より大きいときには、前記共鳴ピーク位置付近の予測された周波数領域係数の前記振幅を減らす、請求項10のいずれか一項に記載の装置。
  12. 復号化された周波数領域信号が前記所定条件を満たさないときには、前記帯域幅拡張ユニットは、雑音を用いて、前予測される周波数領域信号を予測するように構成される、請求項11のいずれか一項に記載の装置。
  13. 記録されたプログラムを有するコンピュータ可読記憶媒体であって、前記プログラムは、コンピュータに請求項1〜のいずれか一項に記載の方法を実行させる、コンピュータ可読記憶媒体。
JP2016175647A 2012-03-29 2016-09-08 信号符号化および復号化の方法および装置 Active JP6323881B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210087702.9A CN103368682B (zh) 2012-03-29 2012-03-29 信号编码和解码的方法和设备
CN201210087702.9 2012-03-29

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015502053A Division JP6006400B2 (ja) 2012-03-29 2012-05-23 信号符号化の方法および装置

Publications (2)

Publication Number Publication Date
JP2017016141A JP2017016141A (ja) 2017-01-19
JP6323881B2 true JP6323881B2 (ja) 2018-05-16

Family

ID=49258139

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2015502053A Active JP6006400B2 (ja) 2012-03-29 2012-05-23 信号符号化の方法および装置
JP2016175647A Active JP6323881B2 (ja) 2012-03-29 2016-09-08 信号符号化および復号化の方法および装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2015502053A Active JP6006400B2 (ja) 2012-03-29 2012-05-23 信号符号化の方法および装置

Country Status (15)

Country Link
US (4) US9537694B2 (ja)
EP (3) EP3249645B1 (ja)
JP (2) JP6006400B2 (ja)
KR (1) KR101621641B1 (ja)
CN (3) CN106409299B (ja)
BR (1) BR112014023577B8 (ja)
CA (2) CA2994705C (ja)
ES (3) ES2770831T3 (ja)
MX (1) MX339652B (ja)
PL (1) PL3664085T3 (ja)
PT (1) PT3249645T (ja)
RU (1) RU2592412C2 (ja)
SG (2) SG11201405216SA (ja)
WO (1) WO2013143221A1 (ja)
ZA (1) ZA201406424B (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10923204B2 (en) 2010-08-20 2021-02-16 Attopsemi Technology Co., Ltd Fully testible OTP memory
US10916317B2 (en) 2010-08-20 2021-02-09 Attopsemi Technology Co., Ltd Programmable resistance memory on thin film transistor technology
US9818478B2 (en) 2012-12-07 2017-11-14 Attopsemi Technology Co., Ltd Programmable resistive device and memory using diode as selector
US10586832B2 (en) 2011-02-14 2020-03-10 Attopsemi Technology Co., Ltd One-time programmable devices using gate-all-around structures
CN106409299B (zh) 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
CN105374363B (zh) * 2014-08-25 2019-06-04 广东美的集团芜湖制冷设备有限公司 音频信号编码方法和系统
US11062786B2 (en) 2017-04-14 2021-07-13 Attopsemi Technology Co., Ltd One-time programmable memories with low power read operation and novel sensing scheme
US10726914B2 (en) 2017-04-14 2020-07-28 Attopsemi Technology Co. Ltd Programmable resistive memories with low power read operation and novel sensing scheme
US10535413B2 (en) 2017-04-14 2020-01-14 Attopsemi Technology Co., Ltd Low power read operation for programmable resistive memories
US11615859B2 (en) 2017-04-14 2023-03-28 Attopsemi Technology Co., Ltd One-time programmable memories with ultra-low power read operation and novel sensing scheme
JP6934648B2 (ja) * 2017-07-03 2021-09-15 東日本旅客鉄道株式会社 トロリ線曲げ工具
EP3701523B1 (en) 2017-10-27 2021-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise attenuation at a decoder
US10770160B2 (en) 2017-11-30 2020-09-08 Attopsemi Technology Co., Ltd Programmable resistive memory formed by bit slices from a standard cell library
CN118053437A (zh) * 2022-11-17 2024-05-17 抖音视界有限公司 音频编码方法、解码方法、装置、设备及存储介质

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5517511A (en) * 1992-11-30 1996-05-14 Digital Voice Systems, Inc. Digital transmission of acoustic signals over a noisy communication channel
JP3131542B2 (ja) 1993-11-25 2001-02-05 シャープ株式会社 符号化復号化装置
KR970011727B1 (en) 1994-11-09 1997-07-14 Daewoo Electronics Co Ltd Apparatus for encoding of the audio signal
JP3521596B2 (ja) 1996-01-30 2004-04-19 ソニー株式会社 信号符号化方法
JP3519859B2 (ja) * 1996-03-26 2004-04-19 三菱電機株式会社 符号器及び復号器
FI970553A (fi) * 1997-02-07 1998-08-08 Nokia Mobile Phones Ltd Audiokoodausmenetelmä ja -laite
US6356211B1 (en) 1997-05-13 2002-03-12 Sony Corporation Encoding method and apparatus and recording medium
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
KR100304092B1 (ko) * 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
US6226616B1 (en) 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US6621935B1 (en) * 1999-12-03 2003-09-16 Microsoft Corporation System and method for robust image representation over error-prone channels
JP2001255882A (ja) 2000-03-09 2001-09-21 Sony Corp 音声信号処理装置及びその信号処理方法
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
DE60209888T2 (de) 2001-05-08 2006-11-23 Koninklijke Philips Electronics N.V. Kodieren eines audiosignals
US7333929B1 (en) * 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
CN1127054C (zh) * 2001-11-02 2003-11-05 北京阜国数字技术有限公司 用于知觉音频编码的信号处理方法
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
US7349842B2 (en) * 2003-09-29 2008-03-25 Sony Corporation Rate-distortion control scheme in audio encoding
US7672838B1 (en) * 2003-12-01 2010-03-02 The Trustees Of Columbia University In The City Of New York Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals
US7586924B2 (en) * 2004-02-27 2009-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
WO2005096273A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Ameliorations apportees a un procede et un dispositif de codage/decodage audio
KR100723400B1 (ko) 2004-05-12 2007-05-30 삼성전자주식회사 복수의 룩업테이블을 이용한 디지털 신호 부호화 방법 및장치
JP4809234B2 (ja) * 2004-09-17 2011-11-09 パナソニック株式会社 オーディオ符号化装置、復号化装置、方法、及びプログラム
RU2404506C2 (ru) 2004-11-05 2010-11-20 Панасоник Корпорэйшн Устройство масштабируемого декодирования и устройство масштабируемого кодирования
MX2007011915A (es) 2005-03-30 2007-11-22 Koninkl Philips Electronics Nv Codificacion de audio multicanal.
US8055500B2 (en) * 2005-10-12 2011-11-08 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding/decoding audio data with extension data
JP2007149151A (ja) * 2005-11-24 2007-06-14 Funai Electric Co Ltd 光ディスク再生装置、音声信号出力装置及びavシステム
KR101237413B1 (ko) 2005-12-07 2013-02-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
TWI333643B (en) * 2006-01-18 2010-11-21 Lg Electronics Inc Apparatus and method for encoding and decoding signal
JP2007264154A (ja) * 2006-03-28 2007-10-11 Sony Corp オーディオ信号符号化方法、オーディオ信号符号化方法のプログラム、オーディオ信号符号化方法のプログラムを記録した記録媒体及びオーディオ信号符号化装置
EP1869669B1 (en) * 2006-04-24 2008-08-20 Nero AG Advanced audio coding apparatus
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
JP4396683B2 (ja) * 2006-10-02 2010-01-13 カシオ計算機株式会社 音声符号化装置、音声符号化方法、及び、プログラム
KR101565919B1 (ko) * 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
RU2406166C2 (ru) * 2007-02-14 2010-12-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов
CN101939782B (zh) * 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
KR100970446B1 (ko) 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
CN101436407B (zh) 2008-12-22 2011-08-24 西安电子科技大学 音频编解码方法
EP2380172B1 (en) * 2009-01-16 2013-07-24 Dolby International AB Cross product enhanced harmonic transposition
CN101494054B (zh) * 2009-02-09 2012-02-15 华为终端有限公司 一种音频码率控制方法及系统
ES2400661T3 (es) * 2009-06-29 2013-04-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de extensión de ancho de banda
CN101958119B (zh) * 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
WO2011048099A1 (en) * 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule
CN102081927B (zh) * 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
BR122021008583B1 (pt) * 2010-01-12 2022-03-22 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
US8751225B2 (en) * 2010-05-12 2014-06-10 Electronics And Telecommunications Research Institute Apparatus and method for coding signal in a communication system
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
CN106409299B (zh) 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备

Also Published As

Publication number Publication date
CN106409299A (zh) 2017-02-15
ES2770831T3 (es) 2020-07-03
WO2013143221A1 (zh) 2013-10-03
US9537694B2 (en) 2017-01-03
CA2994705C (en) 2020-06-30
SG11201405216SA (en) 2014-11-27
US20170352359A1 (en) 2017-12-07
JP6006400B2 (ja) 2016-10-12
ES2655832T3 (es) 2018-02-21
JP2017016141A (ja) 2017-01-19
BR112014023577A8 (pt) 2021-05-25
EP3249645B1 (en) 2019-11-13
SG10201701275XA (en) 2017-03-30
CN106409299B (zh) 2019-11-05
BR112014023577A2 (pt) 2017-06-20
US9786293B2 (en) 2017-10-10
MX339652B (es) 2016-06-02
CA2866202A1 (en) 2013-10-03
US9899033B2 (en) 2018-02-20
EP3664085A1 (en) 2020-06-10
PT3249645T (pt) 2020-02-05
CA2994705A1 (en) 2013-10-03
RU2014142255A (ru) 2016-05-20
CN103368682A (zh) 2013-10-23
JP2015517119A (ja) 2015-06-18
CN110706715B (zh) 2022-05-24
US20150010021A1 (en) 2015-01-08
US10600430B2 (en) 2020-03-24
CN110706715A (zh) 2020-01-17
EP2809009A1 (en) 2014-12-03
EP3249645A1 (en) 2017-11-29
RU2592412C2 (ru) 2016-07-20
ZA201406424B (en) 2019-04-24
PL3664085T3 (pl) 2022-11-14
EP2809009A4 (en) 2015-07-15
EP3664085B1 (en) 2022-07-06
BR112014023577B1 (pt) 2021-08-24
US20180130481A1 (en) 2018-05-10
KR20140130182A (ko) 2014-11-07
BR112014023577B8 (pt) 2021-10-05
CN103368682B (zh) 2016-12-07
ES2927563T3 (es) 2022-11-08
EP2809009B1 (en) 2017-11-29
MX2014011605A (es) 2014-10-17
KR101621641B1 (ko) 2016-05-16
CA2866202C (en) 2018-04-03
US20170076733A1 (en) 2017-03-16

Similar Documents

Publication Publication Date Title
JP6323881B2 (ja) 信号符号化および復号化の方法および装置
ES2706148T3 (es) Dispositivo de codificación de audio vocal, dispositivo de decodificación de audio vocal, procedimiento de codificación de audio vocal, y procedimiento de decodificación de audio vocal
JP6574820B2 (ja) 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス
EP3525206B1 (en) Encoding method and apparatus
EP3413307B1 (en) Audio signal coding apparatus, audio signal decoding device, and methods thereof
KR101736705B1 (ko) 오디오 신호를 위한 비트 할당 방법 및 장치
RU2702265C1 (ru) Способ и устройство обработки сигналов
KR102299916B1 (ko) 채널-간 위상 차이 파라미터 코딩 방법 및 디바이스

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180313

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180405

R150 Certificate of patent or registration of utility model

Ref document number: 6323881

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250