JP5600822B2 - 正弦波置換を用いた音声符号化および復号化のための装置および方法 - Google Patents
正弦波置換を用いた音声符号化および復号化のための装置および方法 Download PDFInfo
- Publication number
- JP5600822B2 JP5600822B2 JP2014508848A JP2014508848A JP5600822B2 JP 5600822 B2 JP5600822 B2 JP 5600822B2 JP 2014508848 A JP2014508848 A JP 2014508848A JP 2014508848 A JP2014508848 A JP 2014508848A JP 5600822 B2 JP5600822 B2 JP 5600822B2
- Authority
- JP
- Japan
- Prior art keywords
- spectral
- value
- coefficients
- coefficient
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
音楽コンテンツの符号化のために適切である同時期に起こる高い圧縮比音声コーデックは、全て変換符号化に依存している。最も顕著な例は、MPEG2/4、Advanced Audio Coding(AAC)およびMPEG−D、Unified Speech and Audio Coding(USAC)である。USACは、Algebraic Code Excited Linear Prediction(ACELP)モジュール、および主に話し言葉の符号化を目的とするTransform Coded Excitation(TCX)モジュール(非特許文献5を参照)、および主に音楽の符号化を目的とするAACで構成される切り換えられたコアを有する。AACと同様に、TCXは、変換ベースの符号化方法である。低いビットレート設定で、特に基礎をなす符号化方式がModified Discrete Cosine Transform(MDCT)(非特許文献1を参照)に基づく場合、これらの符号化方式は鳥のさえずりのようなアーチファクトを呈しやすい。
- 複数のスペクトル係数を含む復号化音声信号スペクトルを得るために、符号化された音声信号スペクトルを処理すること。
- 復号化音声信号スペクトルの1つ以上の擬似係数(擬似係数の各々はスペクトル位置およびスペクトル値を有する)を決定すること。
- 修正された音声信号スペクトルを得るために1つ以上の擬似係数を所定の値に設定すること。
- 時間領域変換信号を得るために修正された音声信号スペクトルを時間領域に変換すること。
- 1つ以上の擬似係数の少なくとも1つのスペクトル位置およびスペクトル値によって制御されている制御可能な発振器によって時間領域発振器信号を生成すること、および、
- 音声出力信号を得るために時間領域変換信号および時間領域発振器信号を混合すること。
- 1つ以上の極値係数を決定すること。
- 極値係数の少なくとも1つの先行点の少なくとも1つまたは後続点の少なくとも1つのスペクトル値を所定の値に設定することによって修正された音声信号スペクトルを得るために音声信号入力スペクトルを修正することであって、音声信号入力スペクトルを修正することは、1つ以上の極値係数のスペクトル値を所定の値に設定しないことによって、または1つ以上の極値係数の少なくとも1つを擬似係数に置換することによって実行され、擬似係数のスペクトル値が所定の値と異なること、
- 符号化された音声信号スペクトルを得るために修正された音声信号スペクトルを処理すること、および
- サイド情報を生成して、送信することであって、サイド情報は、修正された音声信号入力スペクトルの範囲内で1つ以上の擬似係数候補の位置を決めることによって生成され、サイド情報は選択された候補として擬似係数の少なくとも1つを選択することにより生成され、サイド情報が生成されて、そのサイド情報が擬似係数として選択された候補を示す。
- スペクトル修正器420は、極値係数を所定の値に設定しない、または:
- スペクトル修正器420が極値係数の少なくとも1つを擬似係数で置換し、擬似係数のスペクトル値は、所定の値と異なる。これは、極値係数の少なくとも1つのスペクトル値が所定の値に設定され、スペクトル係数の別のもののスペクトル値が所定の値と異なる値に設定されることを意味する。このような値は、前記極値係数の先行点の1つ、または、前記極値係数の後続点の1つの前記極値係数のスペクトル値から引き出される。または、そのような値は、前記極値係数の先行点の1つ、または、前記極値係数の後続点の1つの前記極値係数の比較値から引き出される。
1)サブシーケンスの各スペクトル係数に対して比較値およびスペクトル位置の積を決定する。
2)第1の合計を得るために、1)において決定された積を合計する。
3)第2の合計を得るために、サブシーケンスの全てのスペクトル係数の比較値を合計する。
4)中間結果を生成するために、第2の合計で第1の合計を割る。
5)重心を得るために、中間結果に近くへの丸めを適用する(近くへの丸め:8.49は8に丸められ、8.5は9に丸められる)。
(0.04・282+0.10・283+0.20・284+0.93・285+0.92・286+0.90・287+0.05・288)/(0.04+0.10+0.20+0.93+0.92+0.90+0.05)=897.25/3.14=285.75 =286.
Claims (31)
- 符号化された音声信号スペクトルに基づいて音声出力信号を生成する装置であって、
複数のスペクトル係数を含む復号化音声信号スペクトルを得るために符号化された音声信号スペクトルを処理するための処理ユニット(110)であって、スペクトル係数の各々は符号化された音声信号スペクトルの範囲内でスペクトル位置およびスペクトル値を有し、スペクトル係数がスペクトル係数のシーケンスを形成するように、スペクトル係数は符号化された音声信号スペクトルの範囲内でそれらのスペクトル位置に基づいて連続して順序付けられる処理ユニット、
復号化音声信号スペクトルの1つ以上の擬似係数を決定するための擬似係数決定器(120)であって、擬似係数の各々がスペクトル位置およびスペクトル値を有する擬似係数決定器、
修正された音声信号スペクトルを得るために1つ以上の擬似係数を所定の値に設定するためのスペクトル修正ユニット(130)、
時間領域変換信号を得るために修正された音声信号スペクトルを時間領域に変換するためのスペクトル−時間変換ユニット(140)、
時間領域発振器信号を生成するための制御可能な発振器(150)であって、1つ以上の擬似係数の少なくとも1つのスペクトル位置およびスペクトル値によって制御される制御可能な発振器(150)、および
音声出力信号を得るために時間領域変換信号と時間領域発振器信号とを混合するためのミキサー(160)を含む、装置。 - スペクトル係数の各々は直近の先行点および直近の後続点の少なくとも一方を有し、前記スペクトル係数の直近の先行点は、スペクトル係数のシーケンスの範囲内で前記スペクトル係数のすぐ前に先行するスペクトル係数の1つであり、前記スペクトル係数の直近の後続点は、シーケンスの範囲内で前記スペクトル係数のすぐ後に続くスペクトル係数のうちの1つであり、擬似係数決定器(120)は、所定の値と異なるスペクトル値を有し、そのスペクトル値が所定の値に等しい直近の先行点を有し、そのスペクトル値が所定の値に等しい直近の後続点を有するシーケンスの少なくとも1つのスペクトル係数を決定することにより復号化音声信号スペクトルの1つ以上の擬似係数を決定するように構成される、請求項1に記載の装置。
- 所定の値はゼロである、請求項2に記載の装置。
- 擬似係数決定器(120)は、そのスペクトル値が所定の値に等しい直近の先行点を含み、そのスペクトル値が所定の値に等しい直近の後続点を含む擬似係数候補としてシーケンスの少なくとも1つのスペクトル係数を決定することにより復号化音声信号スペクトルの1つ以上の擬似係数を決定するように構成され、
擬似係数決定器(120)は、擬似係数候補が擬似係数であることをサイド情報が示すかどうかを決定することにより、擬似係数候補が擬似係数であるかどうかを決定するように構成される、請求項2または請求項3に記載の装置 - 発振器信号の発振器信号周波数が1つ以上の擬似係数の1つのスペクトル位置に依存するように、制御可能な発振器(150)は発振器信号周波数を有する時間領域発振器信号を生成するように構成される、請求項1ないし請求項4のいずれかに記載の装置。
- 擬似係数は、各々が符号成分を有する符号付きの値であり、
制御可能な発振器(150)は、符号成分が第1の符号値を有するとき発振器信号周波数が第1の周波数値を有し、符号成分が異なる第2の値を有するとき発振器信号周波数が異なる第2の周波数値を有するように、発振器信号の発振器信号周波数がさらに1つ以上の擬似係数の1つの符号成分に依存するように、時間領域発振器信号を生成するように構成される、請求項5に記載の装置。
方法。 - 制御可能な発振器(150)は時間領域発振器信号を生成するように構成され、スペクトル値が第3の値を有するときに発振器信号の大きさが第1の振幅値を有し、スペクトル値が異なる第4の値を有するときに発振器信号の大きさは異なる第2の振幅値を有するように、発振器信号の大きさが1つ以上の擬似係数の1つのスペクトル値に依存し、第4の値が第3の値より大きいとき第2の振幅値は第1の振幅値より大きい、請求項1ないし請求項6のいずれかに記載の装置。
- 制御可能な発振器(150)は、さらに、先行するフレームの擬似係数から引き出される1つ以上の外挿パラメータによって制御される、請求項1ないし請求項7のいずれかに記載の装置。
- 修正された音声信号スペクトルはMDCT係数を含むMDCTスペクトルであり、
スペクトル−時間変換ユニット(140)は、復号化された音声信号スペクトルの少なくともいくつかの係数を時間領域に変換することにより、MDCTスペクトルをMDCT領域から時間領域に変換するように構成された、請求項1ないし請求項8のいずれかに記載の装置。 - ミキサー(160)は、時間領域において、時間領域発振器信号に時間領域変換信号を加えることにより、時間領域変換信号と時間領域発振器信号とを混合するように構成された、請求項1ないし請求項9のいずれかに記載の装置。
- 制御可能な発振器(150)によって生成される時間領域発振器信号は第1の時間領域発振器信号であり、
さらに、装置は、1つ以上の更なる時間領域発振器信号を生成するための1つ以上の更なる制御可能な発振器(252、254、256)を含み、1つ以上の更なる制御可能な発振器(252、254、256)の各々は、1つ以上の更なる時間領域発振器信号の1つを生成するように構成され、更なる制御可能な発振器(252、254、256)の各々は、1つ以上の擬似係数の少なくとも1つのスペクトル位置およびスペクトル値によって制御され、
ミキサー(160)は、音声出力信号を得るために、第1の時間領域発振器信号、1つ以上の更なる時間領域発振器信号および時間領域変換信号を混合するように構成される、請求項1ないし請求項9のいずれかに記載の装置。 - 音声信号の音声信号入力スペクトルを符号化するための装置であって、音声信号入力スペクトルは複数のスペクトル係数を含み、スペクトル係数の各々は音声信号入力スペクトルの範囲内でスペクトル位置とスペクトル値とを有し、スペクトル係数は音声信号入力スペクトルの範囲内のスペクトル位置に従って連続して順序付けられてスペクトル係数がスペクトル係数のシーケンスを形成し、スペクトル係数の各々は1つ以上の先行点と1つ以上の後続点の少なくとも1つを有し、前記スペクトル係数の各々の先行点はシーケンスの範囲内の前記スペクトル係数に先行するスペクトル係数の1つであり、前記スペクトル係数の各々の後続点はシーケンスの範囲内の前記スペクトル係数に続くスペクトル係数の1つである装置であって、装置は、
1つ以上の極値係数を決定するための極値決定器(410)、
極値係数の少なくとも1つの先行点の少なくとも1つまたは後続点の少なくとも1つのスペクトル値を所定の値に設定することによって修正された音声信号スペクトルを得るために音声信号入力スペクトルを修正するためのスペクトル修正器(420)であって、スペクトル修正器(420)が1つ以上の極値係数のスペクトル値を所定の値に設定せず、または1つ以上の極値係数の少なくとも1つを擬似係数で置換するように構成され、擬似係数のスペクトル値は所定の値とは異なるものであるスペクトル修正器、
符号化された音声信号スペクトルを得るために修正された音声信号スペクトルを処理するための処理ユニット(430)、および
サイド情報を生成して送信するためのサイド情報発生器(440)であって、サイド情報発生器(440)はスペクトル修正器(420)によって生成された修正された音声信号入力スペクトルの範囲内で1つ以上の擬似係数候補を位置付けるように構成され、サイド情報発生器(440)は選択された候補として擬似係数候補の少なくとも1つを選択するように構成され、サイド情報が擬似係数として選択された候補を示すようにサイド情報発生器(440)はサイド情報を生成するように構成されるサイド情報発生器を含み、
極値係数の各々は、そのスペクトル値がその先行点の少なくとも1つのスペクトル値より大きく、そのスペクトル値がその後続点の少なくとも1つのスペクトル値より大きいスペクトル係数の1つであるように、極値決定器(410)は1つ以上の極値係数を決定するように構成され、
スペクトル係数の各々は前記スペクトル係数と関連した比較値を有し、極値係数の各々は、その比較値がその先行点の少なくとも1つの比較値より大きく、その比較値がその後続点の少なくとも1つの比較値より大きいスペクトル係数の1つであるように、極値決定器(410)は1つ以上の極値係数を決定するように構成される、装置。 - サイド情報発生器(440)はサイド情報のサイズを送信するように構成される、請求項12に記載の装置。
- 音声信号入力スペクトルのスペクトル係数の少なくともいくつかが修正された音声信号スペクトルの中で修正されないままにされるように、スペクトル決定器(420)は音声信号入力スペクトルを修正するように構成される、請求項12または請求項13に記載の装置。
- スペクトル係数の各々は、その先行点の1つとして直近の先行点およびその後続点の1つとして直近の後続点の少なくとも1つを有し、前記スペクトル係数の直近の先行点は、シーケンスの中で前記スペクトル係数のすぐ前に先行するスペクトル係数の1つであり、前記スペクトル係数の直近の後続点は、シーケンスの中で前記スペクトル係数のすぐ後に続くスペクトル係数の1つであり、
スペクトル修正器(420)は、修正された音声信号スペクトルを得るために極値係数の少なくとも1つの直近の先行点または直近の後続点のスペクトル値を所定の値に設定することにより音声信号入力スペクトルを修正するように構成され、スペクトル修正器(420)は、1つ以上の極値係数のスペクトル値を所定の値に設定しないように構成され、または、1つ以上の極値係数の少なくとも1つを擬似係数で置換するように構成され、擬似係数のスペクトル値は所定の値とは異なり、
極値係数の各々は、そのスペクトル値がその直近の先行点のスペクトル値より大きく、そのスペクトル値がその直近の後続点のスペクトル値より大きいスペクトル値の1つであるように、極値決定器(410)は1つ以上の極値係数を決定するように構成され、または、スペクトル係数の各々は、前記スペクトル係数に関連する比較値を有し、極値係数の各々は、その比較値がその直近の先行点の比較値より大きく、その比較値がその直近の後続手点の比較値より大きいスペクトル係数の1つであるように、極値決定器(410)は1つ以上の極値係数を決定するように構成される、請求項12ないし請求項14のいずれかに記載の装置。 - 1つ以上の極小係数の各々は、そのスペクトル値がその先行点の1つのスペクトル値より小さく、そのスペクトル値がその後続点の1つのスペクトル値より小さいスペクトル係数の1つであるように、極値決定器(410)は1つ以上の極小係数を決定するように構成され、または、スペクトル係数の各々は前記スペクトル係数に関連する比較値を有し、極値決定器(410)は1つ以上の極小係数を決定するように構成され、極小係数の各々は、その比較値がその先行点の1つの比較値より小さく、その比較値がその後続点の1つの比較値より小さいスペクトル係数の1つであり、
スペクトル修正器(420)は、極値係数の1つ以上および極小係数の1つ以上のスペクトル値または比較値に基づいて代表値を決定するように構成され、代表値は所定の値とは異なり、スペクトル修正器(420)は、前記スペクトル値を代表値に設定することにより音声信号入力スペクトルの係数の1つのスペクトル値を変えるように構成される、請求項15に記載の装置。 - スペクトル修正器(420)は、極値係数の1つの比較値またはスペクトル値の1つの間の値の差が閾値より小さいかどうかを決定するように構成され、
音声信号入力スペクトルのスペクトル係数の少なくともいくつかのスペクトル値が、値の差が閾値より小さいかどうかに応じて修正された音声信号スペクトルにおいて修正されていないままにされるように、スペクトル修正器(420)は音声信号入力スペクトルを修正するように構成される、請求項16に記載の装置。 - サブシーケンスのそれぞれは、複数の後続のスペクトル係数音声信号入力スペクトルを含み、後続のスペクトル係数はそれらのスペクトル位置に従ってサブシーケンスの範囲内で連続して順序付けられ、サブシーケンスの各々は前記連続して順序付けられたサブシーケンスにおいて最初である最初の成分と、前記連続して順序付けられたサブシーケンスにおいて最後である最後の成分とを含み、サブシーケンスの各々は極小係数の正確に2つおよび極値係数の正確に1つを含み、極小係数の1つはサブシーケンスの最初の成分であり、極小係数の他の1つはサブシーケンスの最後の成分であるように、極値決定器(410)はスペクトル値のシーケンスの1つ以上のサブシーケンスを決定するように構成され、
スペクトル修正器(420)はサブシーケンスの1つの係数のスペクトル値または比較値に基づいて代表値を決定するように構成され、スペクトル修正器(420)は前記スペクトル値を代表値に設定することによって前記サブシーケンスの係数の1つのスペクトル値を変えるように構成される、請求項16または請求項17に記載の装置。 - スペクトル修正器(420)は、サブシーケンスの前記1つの係数の比較値の二乗の合計を決定することによって代表値を決定するように構成される、請求項18に記載の装置。
- 極値決定器(410)は、複数の加重係数を得るためにサブシーケンスの各スペクトル係数のための比較値および位置値の積を決定することにより、第1の合計を得るために加重係数を合計することにより、第2の合計を得るためにサブシーケンスの全てのスペクトル係数の比較値を合計することにより、中間結果を得るために第1の合計を第2の合計で割ることにより、および重心係数を得るために中間結果に最も近い値への丸めを適用することにより、重心係数を決定するように構成され、スペクトル修正器(420)は、所定の値に対する重心係数ではない、サブシーケンスの全てのスペクトル係数のスペクトル値を設定するように構成され、または
極値決定器(410)は、複数の加重係数を得るためにサブシーケンスの各スペクトル係数のためのスペクトル値および位置値の積を決定することにより、第1の合計を得るために加重係数を合計することにより、第2の合計を得るためにサブシーケンスの全てのスペクトル係数のスペクトル値を合計することにより、中間結果を得るために第1の合計を第2の合計で割ることにより、および重心係数を得るために中間結果に最も近い値への丸めを適用することにより、重心係数を決定するように構成され、スペクトル修正器(420)は、所定の値に対する重心係数ではない、サブシーケンスの全てのスペクトル係数のスペクトル値を設定するように構成される、請求項18または請求項19に記載の装置。 - 所定の値はゼロである、請求項12ないし請求項20のいずれかに記載の装置。
- 各スペクトル係数の比較値は、音声信号のエネルギー保存変換から生じている更なるスペクトルの更なる係数の二乗値である、請求項12ないし請求項21のいずれかに記載の装置。
- 各スペクトル係数の比較値は、音声信号のエネルギー保存変換から生じている更なるスペクトルの更なる係数の振幅値である、請求項12ないし請求項22のいずれかに記載の装置。
- 更なるスペクトルはComplex Modified Discrete Cosine Transformスペクトルであり、エネルギー保存変換はComplex Modified Discrete Cosine Transformである、請求項12ないし請求項23のいずれかに記載の装置。
- スペクトル修正器(420)は微調整情報を受信するように構成され、
音声信号入力スペクトルのスペクトル係数は、それぞれ符号成分を含む符号値であり、
微調整情報が修正された音声信号スペクトルを得るための第1の微調整状態であるとき、スペクトル修正器(420)は1つ以上の極値係数の、または、擬似係数の1つのスペクトル値の符号成分を第1の符号値に設定するように構成され、
微調整情報が修正された音声信号スペクトルを得るための異なる第2の微調整状態にあるとき、スペクトル修正器(420)は1つ以上の極値係数の、または、擬似係数の1つのスペクトル値の符号成分を異なる第2の符号値に設定するように構成される、請求項12ないし請求項24のいずれかに記載の装置。 - 音声信号入力スペクトルはMDCT係数を含むMDCTスペクトルである、請求項12ないし請求項25のいずれかに記載の装置。
- 処理ユニット(430)は、量子化された音声信号スペクトルを得るために修正された音声信号スペクトルを量子化するように構成され、
処理ユニット(430)は、符号化された音声信号スペクトルを得るために量子化された音声信号スペクトルを処理するようにさらに構成され、
処理ユニット(430)は、そのスペクトル値が所定の値に等しい直近の先行点およびそのスペクトル値が所定の値に等しい直近の後続点を有する量子化された音声信号スペクトルのそれらのスペクトル係数のためにだけ前記スペクトル係数が極値係数の1つであるかどうかを示しているサイド情報を生成するように構成され、
前記スペクトル係数の直近の先行点は量子化された音声信号スペクトルの範囲内で前記スペクトル係数のすぐ前に先行する他のスペクトル係数であり、前記スペクトル係数の直近の後続点は量子化された音声信号スペクトルの範囲内で前記スペクトル係数のすぐ後に続く他のスペクトル係数である、請求項12ないし請求項26のいずれかに記載の装置。 - スペクトル修正器(420)は、極値係数の1つを、前記極値係数のスペクトル値または比較値から、前記極値係数の先行点の1つの前記極値係数のスペクトル値または比較値から、または、前記極値係数の後続点の1つの前記極値係数のスペクトル値または比較値から引き出されたスペクトル値を有する擬似係数で置換するように構成される、請求項12ないし請求項27のいずれかに記載の装置。
- 符号化された音声信号スペクトルに基づいて音声出力信号を生成する方法であって、スペクトル係数の各々は、符号化された音声信号スペクトルの範囲内でスペクトル位置およびスペクトル値を有し、スペクトル係数がスペクトル係数のシーケンスを形成するように、スペクトル係数は符号化された音声信号スペクトルの範囲内でそれらのスペクトル位置に従って連続して順序付けられる方法であって、この方法は、
複数のスペクトル係数を含む復号化音声信号スペクトルを得るために符号化された音声信号スペクトルを処理するステップ、
復号化音声信号スペクトルの1つ以上の擬似係数であって、擬似係数の各々はスペクトル位置およびスペクトル値を有する擬似係数を決定するステップ、
修正された音声信号スペクトルを得るために1つ以上の擬似係数を所定の値に設定するステップ、
時間領域変換信号を得るために修正された音声信号スペクトルを時間領域に変換するステップ、
1つ以上の擬似係数の少なくとも1つのスペクトル位置およびスペクトル値によって制御される制御可能な発振器によって時間領域発振器信号を生成するステップ、および
音声出力信号を得るために時間領域変換信号と時間領域発振器信号とを混合するステップを含む、方法。 - 複数のスペクトル係数を含む音声信号入力スペクトルを符号化する方法であって、スペクトル係数の各々は、音声信号入力スペクトルの範囲内のスペクトル位置、スペクトル値および比較値を有し、スペクトル係数がスペクトル係数のシーケンスを形成するようにスペクトル係数は音声信号入力スペクトルの範囲内でそれらのスペクトル位置に従って連続して順序付けられ、スペクトル係数の各々は、1つ以上の先行点および1つ以上の後続点の少なくとも1つを有し、前記スペクトル係数の先行点の各々はシーケンスの範囲内で前記スペクトル係数に先行するスペクトル係数の1つであり、前記スペクトル係数の後続点の各々はシーケンスの範囲内で前記スペクトル係数に続くスペクトル係数の1つである方法であって、この方法は、
1つ以上の極値係数を決定するステップ、
極値係数の少なくとも1つの先行点の少なくとも1つまたは後続点の少なくとも1つのスペクトル値を所定の値に設定することによって修正された音声信号スペクトルを得るために音声信号入力スペクトルを修正するステップであって、音声信号入力スペクトルを修正することは、1つ以上の極値係数を所定の値に設定しないことによって、または、1つ以上の極値係数の少なくとも1つを擬似係数で置換することによって実行され、擬似係数のスペクトル値は所定の値と異なるものであるステップ、
符号化された音声信号スペクトルを得るために修正された音声信号スペクトルを処理するステップ、および
サイド情報を生成して送信するステップであって、サイド情報は、修正された音声信号入力スペクトルの範囲内で1つ以上の擬似係数候補の位置を決めることによって生成され、サイド情報は選択された候補として擬似係数候補の少なくとも1つを選択することによって生成され、サイド情報が擬似係数として選択された候補を示すようにサイド情報が生成されるステップを含み、
極値係数の各々は、そのスペクトル値がその先行点の少なくとも1つのスペクトル値より大きく、そのスペクトル値がその後続点の少なくとも1つのスペクトル値より大きいスペクトル係数の1つであるように、1つ以上の極値係数が決定され、または、
スペクトル係数の各々は、前記スペクトル係数に関連する比較値を有し、極値係数の各々は、その比較値がその先行点の少なくとも1つの比較値より大きく、その比較値がその後続点の少なくとも1つの比較値より大きいスペクトル係数の1つであるように、1つ以上の極値係数が決定される、方法。 - コンピュータまたは信号処理器で実行されるときに、請求項29または30の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261588998P | 2012-01-20 | 2012-01-20 | |
US61/588,998 | 2012-01-20 | ||
PCT/EP2012/076746 WO2013107602A1 (en) | 2012-01-20 | 2012-12-21 | Apparatus and method for audio encoding and decoding employing sinusoidal substitution |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014517932A JP2014517932A (ja) | 2014-07-24 |
JP5600822B2 true JP5600822B2 (ja) | 2014-10-08 |
Family
ID=47603553
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014508848A Active JP5600822B2 (ja) | 2012-01-20 | 2012-12-21 | 正弦波置換を用いた音声符号化および復号化のための装置および方法 |
Country Status (19)
Country | Link |
---|---|
US (1) | US9343074B2 (ja) |
EP (1) | EP2673776B1 (ja) |
JP (1) | JP5600822B2 (ja) |
KR (1) | KR101672025B1 (ja) |
CN (1) | CN103493130B (ja) |
AR (1) | AR089772A1 (ja) |
AU (1) | AU2012366843B2 (ja) |
BR (1) | BR112013026452B1 (ja) |
CA (2) | CA2848275C (ja) |
ES (1) | ES2545053T3 (ja) |
HK (1) | HK1192640A1 (ja) |
MX (1) | MX350686B (ja) |
MY (1) | MY157163A (ja) |
PL (1) | PL2673776T3 (ja) |
RU (1) | RU2562383C2 (ja) |
SG (1) | SG194706A1 (ja) |
TW (1) | TWI503815B (ja) |
WO (1) | WO2013107602A1 (ja) |
ZA (1) | ZA201308073B (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105122357B (zh) * | 2013-01-29 | 2019-04-23 | 弗劳恩霍夫应用研究促进协会 | 频域中基于lpc进行编码的低频增强 |
KR101757338B1 (ko) | 2013-06-21 | 2017-07-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 오디오 신호의 대체 프레임에 대한 스펙트럼 계수들을 획득하기 위한 방법과 장치, 오디오 디코더, 오디오 수신기 및 오디오 신호들의 전송을 위한 시스템 |
CN104934032B (zh) * | 2014-03-17 | 2019-04-05 | 华为技术有限公司 | 根据频域能量对语音信号进行处理的方法和装置 |
US9672843B2 (en) | 2014-05-29 | 2017-06-06 | Apple Inc. | Apparatus and method for improving an audio signal in the spectral domain |
EP3067889A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for signal-adaptive transform kernel switching in audio coding |
CN107924683B (zh) * | 2015-10-15 | 2021-03-30 | 华为技术有限公司 | 正弦编码和解码的方法和装置 |
US10146500B2 (en) | 2016-08-31 | 2018-12-04 | Dts, Inc. | Transform-based audio codec and method with subband energy smoothing |
US10839814B2 (en) * | 2017-10-05 | 2020-11-17 | Qualcomm Incorporated | Encoding or decoding of audio signals |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483878A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019195269A1 (en) * | 2018-04-04 | 2019-10-10 | Harman International Industries, Incorporated | Dynamic audio upmixer parameters for simulating natural spatial variations |
US11031024B2 (en) | 2019-03-14 | 2021-06-08 | Boomcloud 360, Inc. | Spatially aware multiband compression system with priority |
TWI789577B (zh) * | 2020-04-01 | 2023-01-11 | 同響科技股份有限公司 | 音訊資料重建方法及系統 |
Family Cites Families (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0215915A4 (en) * | 1985-03-18 | 1987-11-25 | Massachusetts Inst Technology | TREATMENT OF ACOUSTIC WAVE SHAPES. |
US4703357A (en) * | 1985-12-24 | 1987-10-27 | Rca Corporation | Adaptive television deghosting system |
US4686570A (en) * | 1985-12-24 | 1987-08-11 | Rca Corporation | Analog-to-digital converter as for an adaptive television deghosting system |
DE8706928U1 (ja) * | 1987-05-14 | 1987-08-06 | Ant Nachrichtentechnik Gmbh, 7150 Backnang, De | |
CA2066851C (en) * | 1991-06-13 | 1996-08-06 | Edwin A. Kelley | Multiple user digital receiver apparatus and method with combined multiple frequency channels |
JP3241098B2 (ja) * | 1992-06-12 | 2001-12-25 | 株式会社東芝 | 多方式対応の受信装置 |
EP0638869B1 (de) * | 1993-08-13 | 1995-06-07 | Siemens Aktiengesellschaft | Verfahren zur hochauflösenden Spektralanalyse bei mehrkanaligen Beobachtungen |
US5640416A (en) * | 1995-06-07 | 1997-06-17 | Comsat Corporation | Digital downconverter/despreader for direct sequence spread spectrum communications system |
US6356555B1 (en) * | 1995-08-25 | 2002-03-12 | Terayon Communications Systems, Inc. | Apparatus and method for digital data transmission using orthogonal codes |
US6266644B1 (en) * | 1998-09-26 | 2001-07-24 | Liquid Audio, Inc. | Audio encoding apparatus and methods |
US6606129B1 (en) * | 1998-12-04 | 2003-08-12 | Samsung Electronics Co., Ltd. | Digital filtering of DTV I-F signal to avoid low-end boost of the baseband signal resulting from in-phase synchrodyne |
US6665638B1 (en) * | 2000-04-17 | 2003-12-16 | At&T Corp. | Adaptive short-term post-filters for speech coders |
JP2002182695A (ja) * | 2000-12-14 | 2002-06-26 | Matsushita Electric Ind Co Ltd | 高能率符号化方法及び装置 |
KR100448892B1 (ko) * | 2002-06-04 | 2004-09-18 | 한국전자통신연구원 | 고전력 증폭기의 비선형 왜곡 보상을 위한 전치 왜곡 장치및 그 방법 |
KR20050021484A (ko) * | 2002-07-16 | 2005-03-07 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
EP1527442B1 (en) * | 2002-08-01 | 2006-04-05 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and audio decoding method based on spectral band replication |
US20040083110A1 (en) * | 2002-10-23 | 2004-04-29 | Nokia Corporation | Packet loss recovery based on music signal classification and mixing |
KR100467617B1 (ko) * | 2002-10-30 | 2005-01-24 | 삼성전자주식회사 | 개선된 심리 음향 모델을 이용한 디지털 오디오 부호화방법과그 장치 |
CN100349207C (zh) * | 2003-01-14 | 2007-11-14 | 北京阜国数字技术有限公司 | 高频耦合的伪小波5声道音频编/解码方法 |
DE10345995B4 (de) * | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
JP2006311353A (ja) * | 2005-04-28 | 2006-11-09 | Samsung Electronics Co Ltd | ダウンコンバータおよびアップコンバータ |
JP5032314B2 (ja) * | 2005-06-23 | 2012-09-26 | パナソニック株式会社 | オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置 |
KR100888474B1 (ko) * | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
JP2009524101A (ja) * | 2006-01-18 | 2009-06-25 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
JP4454604B2 (ja) * | 2006-06-19 | 2010-04-21 | シャープ株式会社 | 信号処理方法、信号処理装置及びプログラム |
KR101299155B1 (ko) * | 2006-12-29 | 2013-08-22 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 |
JP4594942B2 (ja) | 2007-01-16 | 2010-12-08 | コベルコ建機株式会社 | 建設機械の冷却構造 |
WO2008114075A1 (en) * | 2007-03-16 | 2008-09-25 | Nokia Corporation | An encoder |
ES2358786T3 (es) | 2007-06-08 | 2011-05-13 | Dolby Laboratories Licensing Corporation | Derivación híbrida de canales de audio de sonido envolvente combinando de manera controlable componentes de señal de sonido ambiente y con decodificación matricial. |
BRPI0816557B1 (pt) * | 2007-10-17 | 2020-02-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Codificação de áudio usando upmix |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
DE102008015702B4 (de) * | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
CA2821035A1 (en) * | 2008-03-10 | 2009-09-17 | Sascha Disch | Device and method for manipulating an audio signal having a transient event |
EP3296992B1 (en) * | 2008-03-20 | 2021-09-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for modifying a parameterized representation |
KR101613975B1 (ko) | 2009-08-18 | 2016-05-02 | 삼성전자주식회사 | 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
JP5587061B2 (ja) | 2009-09-30 | 2014-09-10 | 三洋電機株式会社 | 抵抗溶接用通電ブロック、この通電ブロックを用いた密閉電池の製造方法及び密閉電池 |
US9117458B2 (en) * | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
US20120212375A1 (en) * | 2011-02-22 | 2012-08-23 | Depree Iv William Frederick | Quantum broadband antenna |
-
2012
- 2012-12-21 CN CN201280018238.6A patent/CN103493130B/zh active Active
- 2012-12-21 BR BR112013026452-7A patent/BR112013026452B1/pt active IP Right Grant
- 2012-12-21 ES ES12818512.1T patent/ES2545053T3/es active Active
- 2012-12-21 KR KR1020137028601A patent/KR101672025B1/ko active IP Right Grant
- 2012-12-21 JP JP2014508848A patent/JP5600822B2/ja active Active
- 2012-12-21 PL PL12818512T patent/PL2673776T3/pl unknown
- 2012-12-21 CA CA2848275A patent/CA2848275C/en active Active
- 2012-12-21 SG SG2013080510A patent/SG194706A1/en unknown
- 2012-12-21 WO PCT/EP2012/076746 patent/WO2013107602A1/en active Application Filing
- 2012-12-21 RU RU2013148123/08A patent/RU2562383C2/ru active
- 2012-12-21 CA CA2831176A patent/CA2831176C/en active Active
- 2012-12-21 MY MYPI2013003947A patent/MY157163A/en unknown
- 2012-12-21 EP EP12818512.1A patent/EP2673776B1/en active Active
- 2012-12-21 MX MX2013012409A patent/MX350686B/es active IP Right Grant
- 2012-12-21 AU AU2012366843A patent/AU2012366843B2/en active Active
-
2013
- 2013-01-18 TW TW102102004A patent/TWI503815B/zh active
- 2013-01-21 AR ARP130100181A patent/AR089772A1/es active IP Right Grant
- 2013-10-29 ZA ZA2013/08073A patent/ZA201308073B/en unknown
- 2013-11-12 US US14/078,468 patent/US9343074B2/en active Active
-
2014
- 2014-06-18 HK HK14105797.8A patent/HK1192640A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
RU2562383C2 (ru) | 2015-09-10 |
TW201346891A (zh) | 2013-11-16 |
WO2013107602A1 (en) | 2013-07-25 |
US20140074486A1 (en) | 2014-03-13 |
EP2673776B1 (en) | 2015-06-17 |
KR20130137235A (ko) | 2013-12-16 |
US9343074B2 (en) | 2016-05-17 |
CN103493130B (zh) | 2016-05-18 |
AU2012366843A1 (en) | 2013-10-10 |
MX350686B (es) | 2017-09-13 |
AR089772A1 (es) | 2014-09-17 |
ZA201308073B (en) | 2015-01-28 |
AU2012366843B2 (en) | 2015-08-06 |
KR101672025B1 (ko) | 2016-11-02 |
CA2831176C (en) | 2014-12-09 |
JP2014517932A (ja) | 2014-07-24 |
RU2013148123A (ru) | 2015-05-10 |
SG194706A1 (en) | 2013-12-30 |
CN103493130A (zh) | 2014-01-01 |
CA2831176A1 (en) | 2013-07-25 |
TWI503815B (zh) | 2015-10-11 |
HK1192640A1 (en) | 2014-08-22 |
PL2673776T3 (pl) | 2015-12-31 |
BR112013026452A2 (pt) | 2017-06-27 |
BR112013026452B1 (pt) | 2021-02-17 |
MY157163A (en) | 2016-05-13 |
ES2545053T3 (es) | 2015-09-08 |
EP2673776A1 (en) | 2013-12-18 |
CA2848275C (en) | 2016-03-08 |
MX2013012409A (es) | 2013-12-06 |
CA2848275A1 (en) | 2014-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5600822B2 (ja) | 正弦波置換を用いた音声符号化および復号化のための装置および方法 | |
JP5350393B2 (ja) | オーディオコーディングシステム、オーディオデコーダ、オーディオエンコーディング方法及びオーディオデコーディング方法 | |
JP7005564B2 (ja) | スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法 | |
KR101508819B1 (ko) | 멀티 모드 오디오 코덱 및 이를 위해 적응된 celp 코딩 | |
KR101205593B1 (ko) | 시간 워핑 윤곽선 계산기, 오디오 신호 인코더, 인코딩된 오디오 신호 표현, 방법 및 컴퓨터 프로그램 | |
MX2011000362A (es) | Esquema de codificacion/decodificacion de audio a baja velocidad binaria y conmutadores en cascada. | |
JP6285939B2 (ja) | 後方互換性のある多重分解能空間オーディオオブジェクト符号化のためのエンコーダ、デコーダおよび方法 | |
CN106537499A (zh) | 用于使用独立噪声填充生成增强信号的装置和方法 | |
US20100250260A1 (en) | Encoder | |
CN117940994A (zh) | 基于长期预测和/或谐波后置滤波生成预测频谱的处理器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140703 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140729 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140818 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5600822 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |