JP2016508618A - 周波数領域におけるlpc系符号化のための低周波数エンファシス - Google Patents
周波数領域におけるlpc系符号化のための低周波数エンファシス Download PDFInfo
- Publication number
- JP2016508618A JP2016508618A JP2015554192A JP2015554192A JP2016508618A JP 2016508618 A JP2016508618 A JP 2016508618A JP 2015554192 A JP2015554192 A JP 2015554192A JP 2015554192 A JP2015554192 A JP 2015554192A JP 2016508618 A JP2016508618 A JP 2016508618A
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- spectral line
- frequency
- predictive coding
- linear predictive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/087—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0016—Codebook for LPC parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明の好ましい実施の形態においては、さらなる基準スペクトル線が、基準スペクトル線RSLより高い周波数を表す。これらの特徴により、最小値MIと最大値MAの推定が、関連の周波数域において行われることが確実になる。
2 線形予測符号化フィルタ
3 時間周波数変換器
4 低周波数エンファシス回路
5 制御装置
6 量子化装置
7 ビットストリーム生成部
8 スペクトル解析部
9 最小値最大値解析部
10 エンファシスファクタ計算部の第1の段
11 エンファシスファクタ計算部の第2の段
12 オーディオデコーダ
13 ビットストリーム受信部
14 逆量子化装置
15 低周波数デエンファシス回路
16 制御装置
17 周波数時間変換器
18 逆線形予測符号化フィルタ
19 スペクトル解析部
20 最小値最大値解析部
21 デエンファシスファクタ計算部の第1の段
22 デエンファシスファクタ計算部の第2の段
AS オーディオ信号
LC 線形予測符号化係数
FF フィルタリングされたフレーム
FI フレーム
SP スペクトル
PS 処理されたスペクトル
QS 量子化されたスペクトル
SR スペクトル表示
MI スペクトル表示の最小値
MA スペクトル表示の最大値
SEF スペクトル線エンファシスファクタ
BEF 位相エンファシスファクタ
FC 時間領域へ変換したフレーム
RSL 基準スペクトル線
SL スペクトル線
DQ 逆量子化されたスペクトル
RS 逆処理されたスペクトル
TS 時間信号
SDF スペクトル線デエンファシスファクタ
BDF 基底デエンファシスファクタ
IFS 逆フィルタリングされた信号
SLD スペクトル線
RSLD 基準スペクトル線
QE 量子化誤差
Claims (28)
- ビットストリーム(BS)を生成するように非音声オーディオ信号(AS)を符号化するためのオーディオエンコーダであって、前記オーディオエンコーダ(1)は、
複数の線形予測符号化係数(LC)を有する線形予測符号化フィルタ(2)と時間周波数変換器(3)との組合せ(2、3)であって、オーディオ信号(AS)のフレーム(FI)および線形予測符号化係数(LC)に基づきスペクトル(SP)を出力するために、前記フレーム(FI)をフィルタリングし、かつ周波数領域へ変換するよう構成される組合せ(2、3)と、
前記スペクトル(SP)に基づき処理されたスペクトル(PS)を計算するよう構成される低周波数エンファシス回路(4)であって、基準スペクトル線(RSL)より低い周波数を表す処理されたスペクトル(PS)のスペクトル線(SL)が強調される、低周波数エンファシス回路(4)と、
前記線形予測符号化フィルタ(2)の線形予測符号化係数(LC)に依拠して前記低周波数エンファシス回路(4)による処理されたスペクトル(PS)の計算を制御するよう構成される制御装置(5)と、
を備える、オーディオエンコーダ。 - 前記オーディオ信号(AS)のフレーム(FI)は、前記線形予測符号化フィルタ(2)に入力され、フィルタリングされたフレーム(FF)は、前記線形予測符号化フィルタ(2)により出力され、前記時間周波数変換器(3)は、フィルタ処理されたフレーム(FF)に基づき前記スペクトル(SP)を推定するよう構成される、先行の請求項に記載のオーディオエンコーダ。
- 前記オーディオ信号(AS)のフレーム(FI)は、前記時間周波数変換器(3)に入力され、変換されたフレーム(FC)は、前記時間周波数変換器(3)により出力され、前記線形予測符号化フィルタ(2)は、変換されたフレーム(FC)に基づいて前記スペクトル(SP)を推定するよう構成される、請求項1に記載のオーディオエンコーダ。
- 前記オーディオエンコーダ(1)は、前記処理されたスペクトル(PS)に基づいて量子化されたスペクトル(QS)を生成するよう構成される量子化装置(6)と、前記量子化されたスペクトル(QS)および前記線形予測符号化係数(LC)を前記ビットストリーム(BS)に埋め込むよう構成されるビットストリーム生成部(7)とを備える、先行の請求項のうちの1つに記載のオーディオエンコーダ。
- 前記制御装置(5)は、前記線形予測符号化係数(LC)のスペクトル表示(SR)を推定するよう構成されるスペクトル解析部(8)と、さらなる基準スペクトル線を下回るスペクトル表示(SR)の最小値(MI)およびスペクトル表示(SR)の最大値(MA)を推定するよう構成される最小値最大値解析部(9)と、前記最小値(MI)および前記最大値(MA)に基づいて前記基準スペクトル線(RSL)より低い周波数を表す処理されたスペクトル(PS)のスペクトル線(SL)を計算するためのスペクトル線エンファシスファクタ(SEF)を計算するよう構成されるエンファシスファクタ計算部(10、11)とを含み、前記処理されたスペクトル(PS)のスペクトル線(SL)は、フィルタリングされたフレームのスペクトルのスペクトル線に対して前記スペクトル線エンファシスファクタ(SEF)を適用することにより強調される、先行の請求項のうちの1つに記載のオーディオエンコーダ。
- 前記エンファシスファクタ計算部(10、11)は、前記スペクトル線エンファシスファクタ(SEF)が、前記基準スペクトル線(RSL)から前記スペクトル(SP)の最低周波数を表すスペクトル線(SL)の方向に増加するように構成される、先行の請求項に記載のオーディオエンコーダ。
- 前記エンファシスファクタ計算部(10、11)は、第1の式、γ=(α・min/max)βにしたがい基底エンファシスファクタ(BEF)を計算するよう構成される第1の段(10)を含み、ここで、αは、第1の予め設定された値であって、α>1であり、βは、第2の予め設定された値であって、0<β≦1であり、minは、前記スペクトル表示(SR)の最小値(MI)であり、maxは、前記スペクトル表示(SR)の最大値(MA)であり、γは、前記基底エンファシスファクタ(BEF)であり、前記エンファシスファクタ計算部(10、11)は、第2の式εi=γi’-iにしたがいスペクトル線エンファシスファクタ(SEF)を計算するよう構成される第2の段(11)を含み、ここでi’は、強調されるべきスペクトル線(SL)の数であり、iは、それぞれのスぺクトル線(SL)のインデクスであり、インデクスはスペクトル線の周波数と共に増加し、i=0〜i’−1であり、γは前記基底エンファシスファクタ(BEF)であり、εiはインデクスiでのスペクトル線エンファシスファクタ(SEF)である、請求項5または6に記載のオーディオエンコーダ。
- 前記第1の予め設定された値は、42より小さくかつ22より大きく、詳細には、38より小さくかつ26より大きく、さらに詳細には34より小さくかつ30より大きい、先行の請求項に記載のオーディオエンコーダ。
- 前記第2の予め設定された値は、式β=1/(θ・i’)にしたがい決定され、ここでi’は、強調されるスペクトル線の数であり、θは、3と5の間、詳細には、3.4と4.6の間、より詳細には3.8と4.2の間のファクタである、請求項7または8に記載のオーディオエンコーダ。
- 前記基準スペクトル線(RSL)は、600Hzと1000Hzの間、詳細には、700Hzと900Hzの間、より詳細には750Hzと850Hzの間の周波数を表す、先行の請求項のうちの1つに記載のオーディオエンコーダ。
- 前記さらなる基準スペクトル線は、前記基準スペクトル線(RSL)と同じかまたはより高い周波数を表す、請求項5から10のうちの1つに記載のオーディオエンコーダ。
- 前記最大値(MA)が、前記最小値(MI)に前記第1の予め設定された値を乗算したものを下回る場合にのみ、前記基準スペクトル線(RSL)より低い周波数を表す処理されたスペクトル(PS)のスペクトル線(SL)が強調されるように、前記制御装置(5)は構成される、先行の請求項のうちの1つに記載のオーディオエンコーダ。
- ビットストリーム(BS)から非音声オーディオ出力信号(OS)を生成するように、前記ビットストリーム(BS)を非音声オーディオ信号(AS)に基づいて復号化するため、特に請求項1から12に記載のオーディオエンコーダ(1)により生成されるビットストリーム(BS)を復号化するためのオーディオデコーダであって、前記ビットストリーム(BS)は、量子化されたスペクトル(QS)および複数の線形予測符号化係数(LC)を含み、前記オーディオデコーダ(12)は、
前記ビットストリーム(BS)から量子化されたスペクトル(QS)と線形予測符号化係数(LC)とを抽出するよう構成されるビットストリーム受信部(13)と、
前記量子化されたスペクトル(QS)に基づいて逆量子化されたスペクトル(DQ)を生成するよう構成される逆量子化装置(14)と、
前記逆量子化されたスペクトル(DQ)に基づいて逆処理されたスペクトル(RS)を計算するよう構成される低周波数デエンファシス回路(15)であって、基準スペクトル線(RSLD)より低い周波数を表す逆処理されたスペクトル(RS)のスペクトル線(SLD)がデエンファサイズされる、低周波数デエンファシス回路(15)と、
前記ビットストリーム(BS)に含まれる線形予測符号化係数(LC)に依拠して、前記低周波数デエンファシス回路(15)による逆処理されたスペクトル(RS)の計算を制御するよう構成される制御装置(16)と、
を備える、オーディオデコーダ。 - 前記オーディオデコーダ(12)は、周波数時間変換器(17)と、前記ビットストリーム(BS)に含まれる複数の線形予測符号化係数(LC)を受信する逆線形予測符号化フィルタ(18)との組合せ(17、18)を備え、前記組合せ(17、18)は、前記逆処理されたスペクトル(RS)および前記線形予測符号化係数(LC)に基づいて出力信号(OS)を出力するために、前記逆処理されたスペクトル(RS)を逆フィルタリングし、かつ時間領域に変換するよう構成される、先行の請求項に記載のオーディオデコーダ。
- 前記周波数時間変換器(17)は、前記逆処理されたスペクトル(RS)に基づいて時間信号(TS)を推定するよう構成され、前記逆線形予測符号化フィルタ(18)は、前記時間信号(TS)に基づいて出力信号(OS)を出力するよう構成される、先行の請求項に記載のオーディオデコーダ。
- 前記逆線形予測符号化フィルタ(18)は、前記逆処理されたスペクトル(RS)に基づいて逆フィルタリングされた信号(IFS)を推定するよう構成され、前記周波数時間変換器(17)は、前記逆フィルタリングされた信号(IFS)に基づいて出力信号(OS)を出力するよう構成される、請求項14に記載のオーディオデコーダ。
- 前記制御装置(16)は、前記線形予測符号化係数(LC)のスペクトル表示(SR)を推定するよう構成されるスペクトル解析部(19)と、さらなる基準スペクトル線を下回るスペクトル表示(SR)の最小値(MI)およびスペクトル表示(SR)の最大値(MA)を推定するよう構成される最小値最大値解析部(20)と、前記最小値(MI)および前記最大値(MA)に基づき、前記基準スペクトル線(RSLD)より低い周波数を表す逆処理されたスペクトル(RS)のスペクトル線(SLD)を計算するためのスペクトル線デエンファシスファクタ(SDF)を計算するよう構成されるデエンファシスファクタ計算部(21、22)とを含み、逆処理されたスペクトル(RS)のスペクトル線(SLD)は、前記スペクトル線デエンファシスファクタ(SDF)を、前記逆量子化されたスペクトル(DQ)のスペクトルのスペクトル線に適用することによりデエンファサイズされる、請求項13から16のうちの1つに記載のオーディオデコーダ。
- 前記スペクトル線デエンファシスファクタ(SDF)が、前記基準スペクトル線(RSLD)から前記逆処理されたスペクトル(RS)の最低周波数を表すスペクトル線(SL)の方向へ減少するように、前記デエンファシスファクタ計算部(21、22)は構成される、先行の請求項に記載のオーディオデコーダ。
- 前記デエンファシスファクタ計算部(21、22)は、第1の式δ=(α・mim/max)‐βにしたがい基底デエンファシスファクタ(BDF)を計算するよう構成される第1の段(21)を含み、ここで、αは、第1の予め設定された値であって、α>1であり、βは、第2の予め設定された値であって、0<β≦1であり、minは前記スペクトル表示(SR)の最小値(MI)であり、maxは、前記スペクトル表示(SR)の最大値であり、δは、前記基底デエンファシスファクタ(BDF)であり、前記デエンファシスファクタ計算部(21、22)は、第2の式ζi=δi’-iにしたがいスペクトル線デエンファシスファクタ(SDF)を計算するよう構成される第2の段(22)を含み、ここでi’は、デエンファサイズされるべきスペクトル線(SLD)の数であり、iは、それぞれのスペクトル線(SLD)のインデクスであり、このインデクスは、スペクトル線の周波数と共に増加し、i=0〜i’−1であり、δは、前記基底デエンファシスファクタ(BDF)であり、ζiが、インデクスiでのスペクトル線デエンファシスファクタ(SDF)である、請求項17または18に記載のオーディオデコーダ。
- 前記第1の予め設定された値は、42より小さくかつ22より大きく、詳細には38より小さくかつ26より大きく、より詳細には34より小さくかつ30より大きい、先行の請求項に記載のオーディオデコーダ。
- 前記第2の予め設定された値は、式β=1/(θ・i’)により決定され、i’は、デエンファサイズされるスペクトル線(SLD)の数であり、θは、3と5の間、詳細には3.4と4.6の間、より詳細には3.8と4.2の間のファクタである、請求項19または20に記載のオーディオデコーダ。
- 前記基準スペクトル線(RSLD)は、600Hzと1000Hzの間、詳細には700Hzと900Hzの間、より詳細には750Hzと850Hzの間の周波数を表す、請求項13から21のうちの1つに記載のオーディオデコーダ。
- 前記さらなる基準スペクトル線は、基準スペクトル線(RSLD)と同じかまたはより高い周波数を表す、請求項17から22のうちの1つに記載のオーディオデコーダ。
- 前記最大値(MA)が、前記最小値(MI)に前記第1の予め設定された値を乗算したものを下回る場合にのみ、前記基準スペクトル線(RSLD)より低い周波数を表す逆処理されたスペクトル(RS)のスペクトル線(SLD)がデエンファサイズされるように、前記制御装置(16)は構成される、請求項13から23のうちの1つに記載のオーディオデコーダ。
- デコーダ(1)およびエンコーダ(12)を含むシステムであって、前記エンコーダ(1)は、請求項1から12のうちの1つにしたがい設計され、かつ/または前記デコーダは、請求項13から24のうちの1つにしたがい設計される、システム。
- ビットストリーム(BS)を生成するように非音声オーディオ信号(AS)を符号化するための方法であって、前記方法は、
オーディオ信号(AS)のフレーム(FI)および線形予測符号化係数(LC)に基づきスペクトル(SP)を出力するために、複数の線形予測符号化係数(LC)を有する線形予測符号化フィルタ(2)で、前記フレーム(FI)をフィルタリングし、かつ周波数領域へ変換するステップと、
前記スペクトル(SP)に基づき処理されたスペクトル(PS)を計算するステップであって、基準スペクトル線(RSL)より低い周波数を表す処理されたスペクトル(PS)のスペクトル線(SL)が強調される、ステップと、
前記線形予測符号化フィルタ(2)の線形予測符号化係数(LC)に依拠して処理されたスペクトル(PS)の計算を制御するステップと、
を含む、方法。 - ビットストリーム(BS)から非音声オーディオ出力信号(OS)を生成するように、前記ビットストリーム(BS)を非音声オーディオ信号(AS)に基づいて復号化するため、特に先行の請求項に記載の方法により生成されるビットストリーム(BS)を復号化するための方法であって、前記ビットストリーム(BS)は、量子化されたスペクトル(QS)および複数の線形予測符号化係数(LC)を含み、前記方法は、
前記ビットストリーム(BS)から量子化されたスペクトル(QS)および線形予測符号化係数(LC)を抽出するステップと、
前記量子化されたスペクトル(QS)に基づいて逆量子化されたスペクトル(DQ)を生成するステップと、
前記逆量子化されたスペクトル(DQ)に基づいて逆処理されたスペクトル(RS)を計算するステップであって、基準スペクトル線(RSLD)より低い周波数を表す逆処理されたスペクトル(RS)のスペクトル線(SLD)がデエンファサイズされる、ステップと、
前記ビットストリーム(BS)に含まれる線形予測符号化係数(LC)に依拠して逆処理されたスペクトル(RS)の計算を制御するステップと、
を含む、方法。 - コンピュータまたは処理装置で実行されるときに、請求項26または27に記載の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361758103P | 2013-01-29 | 2013-01-29 | |
US61/758,103 | 2013-01-29 | ||
PCT/EP2014/051585 WO2014118152A1 (en) | 2013-01-29 | 2014-01-28 | Low-frequency emphasis for lpc-based coding in frequency domain |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016508618A true JP2016508618A (ja) | 2016-03-22 |
JP6148811B2 JP6148811B2 (ja) | 2017-06-14 |
Family
ID=50030281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015554192A Active JP6148811B2 (ja) | 2013-01-29 | 2014-01-28 | 周波数領域におけるlpc系符号化のための低周波数エンファシス |
Country Status (20)
Country | Link |
---|---|
US (5) | US10176817B2 (ja) |
EP (1) | EP2951814B1 (ja) |
JP (1) | JP6148811B2 (ja) |
KR (1) | KR101792712B1 (ja) |
CN (2) | CN105122357B (ja) |
AR (2) | AR094682A1 (ja) |
AU (1) | AU2014211520B2 (ja) |
BR (1) | BR112015018040B1 (ja) |
CA (1) | CA2898677C (ja) |
ES (1) | ES2635142T3 (ja) |
HK (1) | HK1218018A1 (ja) |
MX (1) | MX346927B (ja) |
MY (1) | MY178306A (ja) |
PL (1) | PL2951814T3 (ja) |
PT (1) | PT2951814T (ja) |
RU (1) | RU2612589C2 (ja) |
SG (1) | SG11201505911SA (ja) |
TW (1) | TWI536369B (ja) |
WO (1) | WO2014118152A1 (ja) |
ZA (1) | ZA201506314B (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014118152A1 (en) | 2013-01-29 | 2014-08-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low-frequency emphasis for lpc-based coding in frequency domain |
FR3024582A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
US9338627B1 (en) | 2015-01-28 | 2016-05-10 | Arati P Singh | Portable device for indicating emergency events |
WO2018049279A1 (en) * | 2016-09-09 | 2018-03-15 | Dts, Inc. | System and method for long-term prediction in audio codecs |
EP3382701A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
CN111386568B (zh) * | 2017-10-27 | 2023-10-13 | 弗劳恩霍夫应用研究促进协会 | 使用神经网络处理器生成带宽增强的音频信号的装置、方法或计算机可读存储介质 |
US10847172B2 (en) * | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
US10957331B2 (en) | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
WO2020146870A1 (en) * | 2019-01-13 | 2020-07-16 | Huawei Technologies Co., Ltd. | High resolution audio coding |
TWI789577B (zh) * | 2020-04-01 | 2023-01-11 | 同響科技股份有限公司 | 音訊資料重建方法及系統 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH086596A (ja) * | 1994-06-21 | 1996-01-12 | Mitsubishi Electric Corp | 音声強調装置 |
JP2007525707A (ja) * | 2004-02-18 | 2007-09-06 | ヴォイスエイジ・コーポレーション | Acelp/tcxに基づくオーディオ圧縮中の低周波数強調の方法およびデバイス |
JP2011527459A (ja) * | 2008-07-11 | 2011-10-27 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | サンプリングされたオーディオ信号のフレームを符号化するためのオーディオエンコーダおよびデコーダ |
Family Cites Families (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4139732A (en) * | 1975-01-24 | 1979-02-13 | Larynogograph Limited | Apparatus for speech pattern derivation |
JPH0738118B2 (ja) * | 1987-02-04 | 1995-04-26 | 日本電気株式会社 | マルチパルス符号化装置 |
US5548647A (en) * | 1987-04-03 | 1996-08-20 | Texas Instruments Incorporated | Fixed text speaker verification method and apparatus |
US4890327A (en) * | 1987-06-03 | 1989-12-26 | Itt Corporation | Multi-rate digital voice coder apparatus |
US5173941A (en) * | 1991-05-31 | 1992-12-22 | Motorola, Inc. | Reduced codebook search arrangement for CELP vocoders |
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
US5774846A (en) * | 1994-12-19 | 1998-06-30 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
DE69628103T2 (de) * | 1995-09-14 | 2004-04-01 | Kabushiki Kaisha Toshiba, Kawasaki | Verfahren und Filter zur Hervorbebung von Formanten |
JPH09230896A (ja) * | 1996-02-28 | 1997-09-05 | Sony Corp | 音声合成装置 |
JP3357795B2 (ja) * | 1996-08-16 | 2002-12-16 | 株式会社東芝 | 音声符号化方法および装置 |
SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
GB9811019D0 (en) * | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
JP3580777B2 (ja) * | 1998-12-28 | 2004-10-27 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 |
US6278972B1 (en) * | 1999-01-04 | 2001-08-21 | Qualcomm Incorporated | System and method for segmentation and recognition of speech signals |
JP3526776B2 (ja) * | 1999-03-26 | 2004-05-17 | ローム株式会社 | 音源装置及び携帯機器 |
US6782361B1 (en) * | 1999-06-18 | 2004-08-24 | Mcgill University | Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system |
JP2001117573A (ja) * | 1999-10-20 | 2001-04-27 | Toshiba Corp | 音声スペクトル強調方法/装置及び音声復号化装置 |
US6754618B1 (en) * | 2000-06-07 | 2004-06-22 | Cirrus Logic, Inc. | Fast implementation of MPEG audio coding |
US6748363B1 (en) * | 2000-06-28 | 2004-06-08 | Texas Instruments Incorporated | TI window compression/expansion method |
US6898566B1 (en) * | 2000-08-16 | 2005-05-24 | Mindspeed Technologies, Inc. | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
JP2002318594A (ja) * | 2001-04-20 | 2002-10-31 | Sony Corp | 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体 |
CN1529882A (zh) * | 2001-05-11 | 2004-09-15 | 西门子公司 | 用于扩展窄带滤波的语音信号、特别是由通信设备发送的语音信号的带宽的方法 |
AU2002352182A1 (en) * | 2001-11-29 | 2003-06-10 | Coding Technologies Ab | Methods for improving high frequency reconstruction |
RU2321901C2 (ru) * | 2002-07-16 | 2008-04-10 | Конинклейке Филипс Электроникс Н.В. | Аудиокодирование |
US8019598B2 (en) * | 2002-11-15 | 2011-09-13 | Texas Instruments Incorporated | Phase locking method for frequency domain time scale modification based on a bark-scale spectral partition |
SG135920A1 (en) * | 2003-03-07 | 2007-10-29 | St Microelectronics Asia | Device and process for use in encoding audio data |
US6988064B2 (en) * | 2003-03-31 | 2006-01-17 | Motorola, Inc. | System and method for combined frequency-domain and time-domain pitch extraction for speech signals |
EP1619666B1 (en) * | 2003-05-01 | 2009-12-23 | Fujitsu Limited | Speech decoder, speech decoding method, program, recording medium |
DE10321983A1 (de) * | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal |
US7640157B2 (en) * | 2003-09-26 | 2009-12-29 | Ittiam Systems (P) Ltd. | Systems and methods for low bit rate audio coders |
DE602004008973T2 (de) * | 2004-05-14 | 2008-05-15 | Loquendo-Società per Azioni | Rauschminderung für die automatische spracherkennung |
US7536302B2 (en) * | 2004-07-13 | 2009-05-19 | Industrial Technology Research Institute | Method, process and device for coding audio signals |
ATE534990T1 (de) * | 2004-09-17 | 2011-12-15 | Panasonic Corp | Skalierbare sprachcodierungsvorrichtung, skalierbare sprachdecodierungsvorrichtung, skalierbares sprachcodierungsverfahren, skalierbares sprachdecodierungsverfahren, kommunikationsendgerät und basisstationsgerät |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
EP1859531A4 (en) * | 2005-03-11 | 2008-04-09 | Agency Science Tech & Res | predictor |
US7599833B2 (en) * | 2005-05-30 | 2009-10-06 | Electronics And Telecommunications Research Institute | Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same |
RU2414009C2 (ru) * | 2006-01-18 | 2011-03-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Устройство и способ для кодирования и декодирования сигнала |
JPWO2007088853A1 (ja) * | 2006-01-31 | 2009-06-25 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法 |
WO2008100503A2 (en) * | 2007-02-12 | 2008-08-21 | Dolby Laboratories Licensing Corporation | Improved ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
JP5618826B2 (ja) * | 2007-06-14 | 2014-11-05 | ヴォイスエイジ・コーポレーション | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
KR101439205B1 (ko) * | 2007-12-21 | 2014-09-11 | 삼성전자주식회사 | 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치 |
ATE500588T1 (de) * | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
RU2536679C2 (ru) * | 2008-07-11 | 2014-12-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен | Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы |
MY178597A (en) * | 2008-07-11 | 2020-10-16 | Fraunhofer Ges Forschung | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, and a computer program |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
RU2591661C2 (ru) * | 2009-10-08 | 2016-07-20 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Многорежимный декодировщик аудио сигнала, многорежимный кодировщик аудио сигналов, способы и компьютерные программы с использованием кодирования с линейным предсказанием на основе ограничения шума |
EP3693964B1 (en) * | 2009-10-15 | 2021-07-28 | VoiceAge Corporation | Simultaneous time-domain and frequency-domain noise shaping for tdac transforms |
MY166169A (en) * | 2009-10-20 | 2018-06-07 | Fraunhofer Ges Forschung | Audio signal encoder,audio signal decoder,method for encoding or decoding an audio signal using an aliasing-cancellation |
EP2362375A1 (en) * | 2010-02-26 | 2011-08-31 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an audio signal using harmonic locking |
JP5648123B2 (ja) * | 2011-04-20 | 2015-01-07 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 音声音響符号化装置、音声音響復号装置、およびこれらの方法 |
US9934780B2 (en) * | 2012-01-17 | 2018-04-03 | GM Global Technology Operations LLC | Method and system for using sound related vehicle information to enhance spoken dialogue by modifying dialogue's prompt pitch |
WO2013107602A1 (en) * | 2012-01-20 | 2013-07-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for audio encoding and decoding employing sinusoidal substitution |
WO2014118152A1 (en) * | 2013-01-29 | 2014-08-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low-frequency emphasis for lpc-based coding in frequency domain |
US20140358529A1 (en) * | 2013-05-29 | 2014-12-04 | Tencent Technology (Shenzhen) Company Limited | Systems, Devices and Methods for Processing Speech Signals |
-
2014
- 2014-01-28 WO PCT/EP2014/051585 patent/WO2014118152A1/en active Application Filing
- 2014-01-28 SG SG11201505911SA patent/SG11201505911SA/en unknown
- 2014-01-28 EP EP14701984.8A patent/EP2951814B1/en active Active
- 2014-01-28 PL PL14701984T patent/PL2951814T3/pl unknown
- 2014-01-28 MX MX2015009752A patent/MX346927B/es active IP Right Grant
- 2014-01-28 JP JP2015554192A patent/JP6148811B2/ja active Active
- 2014-01-28 KR KR1020157022714A patent/KR101792712B1/ko active IP Right Grant
- 2014-01-28 ES ES14701984.8T patent/ES2635142T3/es active Active
- 2014-01-28 CA CA2898677A patent/CA2898677C/en active Active
- 2014-01-28 CN CN201480006543.2A patent/CN105122357B/zh active Active
- 2014-01-28 PT PT147019848T patent/PT2951814T/pt unknown
- 2014-01-28 CN CN201910222132.1A patent/CN110047500B/zh active Active
- 2014-01-28 AU AU2014211520A patent/AU2014211520B2/en active Active
- 2014-01-28 BR BR112015018040-0A patent/BR112015018040B1/pt active IP Right Grant
- 2014-01-28 MY MYPI2015001900A patent/MY178306A/en unknown
- 2014-01-28 RU RU2015136223A patent/RU2612589C2/ru active
- 2014-01-29 TW TW103103509A patent/TWI536369B/zh active
- 2014-01-29 AR ARP140100298A patent/AR094682A1/es active IP Right Grant
-
2015
- 2015-07-28 US US14/811,716 patent/US10176817B2/en active Active
- 2015-08-28 ZA ZA2015/06314A patent/ZA201506314B/en unknown
-
2016
- 2016-05-24 HK HK16105887.7A patent/HK1218018A1/zh unknown
-
2018
- 2018-04-18 US US15/956,591 patent/US10692513B2/en active Active
-
2019
- 2019-08-02 AR ARP190102203A patent/AR115901A2/es unknown
-
2020
- 2020-06-11 US US16/899,328 patent/US11568883B2/en active Active
-
2022
- 2022-11-22 US US17/992,496 patent/US11854561B2/en active Active
-
2023
- 2023-12-05 US US18/529,840 patent/US20240119953A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH086596A (ja) * | 1994-06-21 | 1996-01-12 | Mitsubishi Electric Corp | 音声強調装置 |
JP2007525707A (ja) * | 2004-02-18 | 2007-09-06 | ヴォイスエイジ・コーポレーション | Acelp/tcxに基づくオーディオ圧縮中の低周波数強調の方法およびデバイス |
JP2011527459A (ja) * | 2008-07-11 | 2011-10-27 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | サンプリングされたオーディオ信号のフレームを符号化するためのオーディオエンコーダおよびデコーダ |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6148811B2 (ja) | 周波数領域におけるlpc系符号化のための低周波数エンファシス | |
JP7354193B2 (ja) | 独立したノイズ充填を用いた強化された信号を生成するための装置および方法 | |
TWI590233B (zh) | 解碼器及其解碼方法、編碼器及其編碼方法、電腦程式 | |
TWI578308B (zh) | 音訊信號頻譜之頻譜係數的編碼技術 | |
KR20130133848A (ko) | 스펙트럼 도메인 잡음 형상화를 사용하는 선형 예측 기반 코딩 방식 | |
KR102423959B1 (ko) | 다운샘플링 또는 스케일 파라미터의 보간을 사용하여 오디오 신호를 인코딩 및 디코딩하기 위한 장치 및 방법 | |
CN110998721B (zh) | 用于使用宽频带滤波器生成的填充信号对已编码的多声道信号进行编码或解码的装置 | |
JP2019164367A (ja) | 低複雑度の調性適応音声信号量子化 | |
AU2015295624B2 (en) | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals | |
JP7003253B2 (ja) | エンコーダおよび/またはデコーダの帯域幅の制御 | |
JP2021502597A (ja) | 一時的ノイズシェーピング |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160927 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20161220 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20161222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170315 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170520 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6148811 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |