JP2016526703A - オーディオ信号の置換フレームのためのスペクトル係数を得るための方法および装置、オーディオデコーダ、オーディオ受信機ならびにオーディオ信号を送信するためのシステム - Google Patents

オーディオ信号の置換フレームのためのスペクトル係数を得るための方法および装置、オーディオデコーダ、オーディオ受信機ならびにオーディオ信号を送信するためのシステム Download PDF

Info

Publication number
JP2016526703A
JP2016526703A JP2016520514A JP2016520514A JP2016526703A JP 2016526703 A JP2016526703 A JP 2016526703A JP 2016520514 A JP2016520514 A JP 2016520514A JP 2016520514 A JP2016520514 A JP 2016520514A JP 2016526703 A JP2016526703 A JP 2016526703A
Authority
JP
Japan
Prior art keywords
frame
replacement
spectrum
peak
phase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016520514A
Other languages
English (en)
Other versions
JP6248190B2 (ja
Inventor
ジャニーヌ スコウスキー、
ジャニーヌ スコウスキー、
ラルフ シュペルシュナイダー、
ラルフ シュペルシュナイダー、
ゴーラン マールコヴィッチ、
ゴーラン マールコヴィッチ、
ヴォルフガング イェーガース、
ヴォルフガング イェーガース、
クリスティアン ヘルムリッヒ、
クリスティアン ヘルムリッヒ、
ベルント エードラー、
ベルント エードラー、
ラルフ ガイガー、
ラルフ ガイガー、
Original Assignee
フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー.
フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー., フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. filed Critical フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー.
Publication of JP2016526703A publication Critical patent/JP2016526703A/ja
Application granted granted Critical
Publication of JP6248190B2 publication Critical patent/JP6248190B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

オーディオ信号の置換フレーム(m)のためのスペクトル係数を得るアプローチが記載される。オーディオ信号のスペクトルの音の成分を、置換フレーム(m)に先行するフレームのスペクトルに存在するピークに基づいて検出する。スペクトルの音の成分について、置換フレーム(m)のスペクトルにおけるピーク(502)およびその周辺のスペクトル係数を予測し、かつスペクトルの非音の成分について、置換フレーム(m)のための非予測スペクトル係数または置換フレーム(m)に先行するフレームの対応するスペクトル係数を使用する。【選択図】図1

Description

本発明は、符号化されたオーディオ信号の送信の分野に関連し、かつより詳細には、オーディオ信号の置換フレームのためのスペクトル係数を得るための方法および装置、オーディオデコーダ、オーディオ受信機ならびにオーディオ信号を送信するためのシステムに関連する。実施形態は、前に受信したフレームに基づいて置換フレームのためのスペクトルを構成するためのアプローチに関連する。
先行技術には、オーディオ受信機でのフレーム損失の扱いに関するいくつかのアプローチが記載される。たとえば、オーディオまたは音声コーデックの受信機側でフレームが失われると、以下のように非特許文献1に記載されるようなフレーム損失封じ込めのための簡単な方法が用いられ得る。
・最後に受信したフレームを繰り返す
・失われたフレームをミュートにする。
・符号スクランブル
また、非特許文献1では、サブバンドにおいて予測器を使用する高度な技術を提示する。予測器による技術と符号スクランブルとを組み合わせ、予測ゲインを、このサブバンドのスペクトル係数について、どの方法を用いるかを決定するサブバントによる決定基準として使用する。
特許文献1では、時間領域における波形信号外挿がMDCT(修正離散余弦変換)領域コーデックに使用される。この種のアプローチは、音声を含むモノラルの信号には良いかもしれない。
1つのフレームの遅延が許容されると、周辺のフレームの内挿を使用して、損失フレームの構成を行うことができる。このようなアプローチについては、特許文献2に記載され、インデックスmの損失フレームにおける音の成分の大きさが、m−1およびm+1のインデクスを付けた隣接するフレームを使用して内挿される。音の成分についてのMDCT係数の符号を規定するサイド情報は、ビットストリームで送信される。他の非音のMDCT係数については、符号スクランブルが使用される。音の成分は、最大の大きさの予め定められた固定された数のスペクトル係数として決定される。このアプローチでは、音の成分として、最大の大きさを有するn個のスペクトル係数を選択する。
Figure 2016526703
Figure 2016526703
Figure 2016526703
ここで、図7のブロック図に記載のFLC(フレーム損失封じ込め)技術の動作について、より詳細に説明する。
図7において、基本的に、4つのモジュールを区別できる。
・整形雑音挿入モジュール(フレーム内挿700、スケールファクタバンド内の大きさスケーリング702およびランダム符号変更712を含む)。
・MDCTビン分類モジュール(擬似スペクトル706およびピーク検出708を含む)。
・音の封じ込め動作モジュール(インデクス集合内での大きさスケーリング704および符号訂正714を含む)。
・スペクトル構成710。
このアプローチは、以下の一般式に基づく。
Figure 2016526703
Figure 2016526703
Figure 2016526703
Figure 2016526703
Figure 2016526703
・音の成分については、音の成分の周波数であるflを伴ってα=cos(πfl)であることがわかる。
エネルギEは、単純な平滑化演算により導かれる擬似パワースペクトルに基づき導かれる。
Figure 2016526703
Figure 2016526703
ピーク検出は、基礎となるシヌソイドに対応するスペクトルピークの正確な位置を検出するために、擬似パワースペクトルにおける極大値のサーチとして行われる。これは、非特許文献3に記載のMPEG−1音響心理学モデルにおいて採用される音識別プロセスに基づく。これから、MDCTビンと言う意味で分析窓のメインローブの帯域幅およびその中心に検出されたピークを有するインデクスの部分集合が規定される。これらのビンは、シヌソイドの音の支配的なMDCTビンとして扱われ、インデクスの部分集合は、個別の音の成分として扱われる。
Figure 2016526703
Figure 2016526703
以下の修正は、非特許文献2に関連する。
・ピーク検出のために使用される擬似パワースペクトルは、以下のとおり導出される。
Figure 2016526703
・知覚的に無関係なまたは偽ピークをなくすため、ピーク検出は、限られたスペクトル領域にのみ適用され、擬似パワースペクトルの絶対最大値に対する相対的閾値を超える極大値のみが考慮される。残りのピークは、大きさの降順でソートし、予め指定された数の上位の最大値を音のピークとして分類する。
・このアプローチは、以下の一般式に基づく(今回は、αが符号付き)。
Figure 2016526703
Figure 2016526703
Figure 2016526703
m、Em-1、Em+1を以下と置換し、
Figure 2016526703
ここで、
Figure 2016526703

であるならば、αの二次式が得られる。したがって、所与のMDCT推定値について、乗算修正ファクタ(A1、A2、A3は、変換行列)のための2つの候補(符号が反対の)が存在する。より良い推定の選択は、非特許文献2に記載されるものと同様に行われる。
・このより高度なアプローチには、前後のフレームのMDST係数を得るために、フレーム損失の前後2つのフレームが必要である。
Figure 2016526703
Figure 2016526703
Figure 2016526703
Figure 2016526703
・修正ファクタは、2つの前のフレームのエネルギを観察することにより決定される。エネルギの計算から、前のフレームのMDST係数は、以下のとおり近似される。
Figure 2016526703
・次いで、シヌソイドエネルギを以下のとおり計算する。
Figure 2016526703
・同様に、フレームm−2のシヌソイドエネルギを計算し、Em-2で示すが、これは、αとは独立である。
・以下のエネルギ要件を採用し、
Figure 2016526703
ここでも、αの二次式が生成される。
・計算された候補の選択プロセスは、上記と同様行われるが、決定ルールは、前のフレームのパワースペクトルのみに当てはまる。
周波数領域における他の遅延のないフレーム損失封じ込めが、特許文献3に記載される。特許文献3の教示は、一般性を失わずに以下のとおり単純化することができる。
・時間信号のDFTを用いる予測
(a)受信した符号化周波数領域係数Cmに対応する復号化時間領域信号からDFTスペクトルを得る。
(b)線形位相変化を想定して、DFTの大きさを変調し、次のフレームCm+1における失われた周波数領域係数を予測する。
Figure 2016526703
Figure 2016526703
ここで、Qm(k)は、Cm(k)に対応するDFT係数の大きさである。
(b)以下を計算する。
Figure 2016526703
(c)大きさおよび位相の線形外挿を実行する。
Figure 2016526703
Figure 2016526703
Figure 2016526703
Figure 2016526703
予測されるべきスペクトル係数の選択については、特許文献3に説明されるが、詳細に説明されていない。
非特許文献6において、準定常信号について、連続するフレーム間の位相差は、ほとんど一定であり、フラクショナル周波数にのみ依存することが認識されている。しかしながら、最後の2つの複素数スペクトルからの線形外挿のみが用いられる。
AMR−WB+(非特許文献7を参照)において、特許文献4に記載の方法が用いられる。特許文献4における方法は、現在のフレームの一部のみが失われたと仮定して、現在のフレームの入手可能なスペクトル係数も使用すると言う意味で、特許文献3に記載の方法を発展させたものである。しかしながら、フレームが完全に失われる状況については、特許文献4では考慮されていない。
MDCT領域における他の遅延のないフレーム損失封じ込めが、特許文献5に記載される。特許文献5では、失われたP番目のフレームが、多重高調波フレームであるかどうかがまず決定される。P番目のフレームの前のK個のフレームのうちK0個のフレームより多いフレームが閾値より小さいスペクトル平坦性を有する場合には、失われたP番目のフレームは、多重高調波フレームである。失われたP番目のフレームが、多重高調波フレームの場合、MDCT−MDST領域における(P−K)番目から(P−2)番目のフレームを、失われたP番目のフレームを予測するために使用する。パワースペクトルが、2つの隣接するパワースペクトル係数より大きい場合には、そのスペクトル係数がピークである。非特許文献8に記載の擬似スペクトルを(P−1)番目のフレームについて使用する。
スペクトル係数Scの集合を、以下のように、L1のパワースペクトルのフレームから構成する。
1個のフレームの各々におけるピークからなるL1個の集合S1、...、SL1を得ると、各集合におけるピークの数は、それぞれN1、...、NL1となる。S1、...、SL1からなるL1個の集合から集合Siを選択する。各ピーク係数mj(集合S1においてj=1...N1)について、mj、mj±1、...、mj±kの中で、他のすべてのピーク集合に属する周波数係数が存在するかどうか判断する。存在する場合には、すべての周波数mj、mj±1、...、mj±kを周波数の集合SCへ入れる。他のすべてのピーク集合に属する周波数係数が存在しない場合には、フレーム内の周波数係数をすべて周波数の集合SCに直接入れる。前記kは、非マイナスの整数である。集合SCにおけるすべてのスペクトル係数について、(P−K)番目から(P−2)番目のMDCT−MDSTフレームの中のL2フレームを用いて位相を予測する。予測は、線形外挿(L2=2の場合)または線形のあてはめ(L2>2の場合)を用いて行う。線形外挿については、以下のとおりであり、
Figure 2016526703
ここで、p、t1およびt2は、フレームインデクスである。
集合SCにないスペクトル係数は、(P−1)番目のフレームの前の複数のフレームを用いて得られるが、その方法は、詳説されていない。
[2]C. J. Hwey, "Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment". Patent US 6,351,730 B2, 2002
[3]S. K. Gupta, E. Choy and S.-U. Ryu, "Encoder-assisted frame loss concealment techniques for audio coding". Patent US 2007/094009 A1 [8]M. Yannick, "Method and apparatus for transmission error concealment of frequency transform coded digital audio signals". Patent EP 0574288 B1, 1993 [11]A. Taleb, "Partial Spectral Loss Concealment in Transform Codecs". Patent US 7,356,748 B2 [12]C. Guoming, D. Zheng, H. Yuan, J. Li, J. Lu, K. Liu, K. Peng, L. Zhibin, M. Wu and Q. Xiaojun, "Compensator and Compensation Method for Audio Frame Loss in Modified Discrete Cosine Transform Domain". Patent US 2012/109659 A1
[1]P. Lauber and R. Sperschneider, "Error Concealment for Comp ressed Digital Audio," in AES 111th Convention, New York, USA, 2001 [4]S.-U. Ryu and K. Rose, "A Frame Loss Concealment Technique for MPEG-AAC," in 120th AES Convention, Paris, France, 2006 [5]ISO/IEC JTC1/SC29/WG11, Information technology -- Codi ng of moving pictures and associated, International Organization for Sta ndardization, 1993 [6]S.-U. Ryu and R. Kenneth, An MDCT domain frame-loss concealment technique for MPEG Advanced Audio Coding, Department od Electrical and Computer Engineering, University of California, 2007 [7]S.-U. Ryu, Source Modeling Approaches to Enhanced Decoding in Lossy Audio Compression and Communication, UNIVERSITY of CALIFORNIA Santa Barbara, 2006 [9]Y. Mahieux, J.-P. Petit and A. Charbonnier, "Transform coding of audio signals using correlation between successive transform blocks," in Acoustics, Speech, and Signal Processing, 1989. ICASSP-89., 1989 [10]3GPP; Technical Specification Group Services and System Aspects, Extended Adaptive Multi-Rate - Wideband (AMR-WB+) codec, 2009 [13]L. S. M. Dauder, "MDCT Analysis of Sinusoids: Exact Results and Applications to Coding Artifacts Reduction," IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING, pp. 302-312, 2004 [14]D. B. Paul, "The Spectral Envelope Estimation Vocoder," IEEE Transactions on Acoustics, Speech, and Signal Processing, pp. 786-794, 1981. [15]A. Ferreira, "Accurate estimation in the ODFT domain of the frequency, phase and magnitude of stationary sinusoids," 2001 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, pp. 47-50, 2001
本発明の目的は、オーディオ信号の置換フレームのためのスペクトル係数を得るための改善されたアプローチを提供することである。
この目的は、請求項1に記載の方法、請求項34に記載の非一時的コンピュータプログラム製品、請求項35または請求項36に記載の装置、請求項37に記載のオーディオコーダ、請求項38に記載のオーディオ受信機および請求項39に記載のオーディオ信号を送信するためのシステムにより達成される。
本発明は、オーディオ信号の置換フレームのためのスペクトル係数を得るための方法を提供し、この方法は、置換フレームに先行するフレームのスペクトルに存在するピークに基づいてオーディオ信号のスペクトルの音の成分を検出するステップと、スペクトルの音の成分について、置換フレームのスペクトルにおけるピークおよびその周辺についてスペクトル係数を予測するステップと、スペクトルの非音の成分について、置換フレームのための非予測スペクトル係数または置換フレームに先行するフレームの対応するスペクトル係数を使用するステップとを含む。
本発明は、オーディオ信号の置換フレームのためのスペクトル係数を取得するための装置を提供し、この装置は、置換フレームに先行するフレームのスペクトルに存在するピークに基づいてオーディオ信号のスペクトルの音の成分を検出するよう構成される検出器と、置換フレームのスペクトルにおけるピークおよびその周辺についてのスペクトル係数を、スペクトルの音の成分について予測するよう構成される予測器とを含み、スペクトルの非音の成分について、置換フレームの非予測スペクトル係数または置換フレームに先行するフレームの対応するスペクトル係数が使用される。
本発明は、オーディオ信号の置換フレームのためのスペクトル係数を取得するための装置を提供し、この装置は、オーディオ信号の置換フレームのためのスペクトル係数を取得するための本発明の方法に従って動作するよう構成される。
本発明は、オーディオ信号の置換フレームのためのスペクトル係数を取得するための本発明の装置を含むオーディオデコーダを提供する。
本発明は、本発明のオーディオデコーダを含むオーディオ受信機を提供する。
本発明は、オーディオ信号を送信するためのシステムを提供し、このシステムは、符号化されたオーディオ信号を生成するよう構成されるエンコーダと、符号化されたオーディオ信号を受信し、かつ符号化されたオーディオ信号を復号するよう構成される本発明のデコーダとを含む。
本発明は、コンピュータで実行されると、オーディオ信号の置換フレームのためのスペクトル係数を得るための本発明の方法を実行する命令を記憶するコンピュータ可読媒体を含む非一時的コンピュータプログラム製品を提供する。
本発明のアプローチは、良い品質で、追加の遅延を導入せずに、音の信号の良好なフレーム損失封じ込めを図る点が有利である。本発明の低遅延コーデックは、音声およびオーディオ信号の両方についてよく機能し、定常の音の信号に特に実行される良いフレーム損失封じ込めを、たとえばエラーのありがちな環境で、うまく利用する点が有利である。モノラルおよび多声信号の遅延のないフレーム損失封じ込めが提案され、これは、非音の信号の劣化なしに音の信号に良い結果をもたらす。
本発明の実施形態によれば、MDCT領域における音の成分の改善された封じ込めが提供される。実施形態は、周波数領域コーデックまたは切替音声/周波数領域コーデックを組み込むオーディオおよび音声符号化に関し、詳細には、MDCT(修正離散余弦変換)領域におけるフレーム損失封じ込めに関する。本発明は、実施形態により、前に受信したフレームに基づいて損失フレームのためのMDCTスペクトルを構成するための遅延なしの方法を提案し、最後に受信されたフレームが、MDCTを用いて周波数領域で符号化される。
好ましい実施形態によれば、本発明のアプローチは、たとえば、最後から2番目の複素数スペクトルを用いてピークの正確な位置または場所を取得し、最後の実スペクトルを用いて、ビンが音かどうかの決定を精査し、かつ音のオンセットまたはオフセットのいずれかをよりよく検出するためにピッチ情報を使用して、音のスペクトルの部分を検出することを含み、ピッチ情報は、すでにビットストリームに存在するかまたはデコーダ側で生成される。さらに、本発明のアプローチは、封じ込めをすべき高調波の信号適応幅を供給することを含む。高調波の一部である各スペクトル係数のフレーム間の位相シフトまたは位相差の計算も行われ、この計算は、最後から2番目のCMDCTを必要とせずに、たとえばCMDCTスペクトル等の最後に入手可能なスペクトルに基づく。実施形態によれば、位相差は、最後に受信したMDCTスペクトルを用いて精査され、この精査は、連続する損失フレームの数に依拠して適応性がある。CMDCTスペクトルは、復号化された時間領域信号から構成することが可能で、これは、コーデックのフレーミングと整合させる必要がなく、かつ低重複窓の特徴を利用することにより、できるだけ損失フレームに近い複素数スペクトルの構成を可能にするので有利である。本発明の実施形態は、時間領域または周波数領域封じ込めのいずれかを使用するためのフレームごとの判断を提供する。
本発明のアプローチが有利なのは、フレームが失われたかまたは置換する必要があると決定した場合に、受信機側ですでに入手可能な情報に基づいて完全に動作し、受信する必要がある追加のサイド情報が必要ないので、追加のサイド情報を受信するかまたはすぐ使える既存の情報から追加のサイド情報を生成する必要性を考えれば、先行技術のアプローチでは発生する付加的な遅延の原因も存在しない点である。
本発明のアプローチは、上記の先行技術のアプローチに比べて、本発明の発明者らが認識した後述するこれらのアプローチの欠点が、本発明のアプローチを適用すれば回避できる点が有利である。
非特許文献1に記載のフレーム損失封じ込めの方法は、十分に確固としておらず、音の信号について十分に良い結果をもたらさない。
特許文献1に記載の時間領域における波形信号外挿は、多声信号を扱えず、正確なピッチラグを決定する必要があるので、非常に定常な音の信号の封じ込めについて必要とする複雑さが大きい。
特許文献2では、追加の遅延が導入され、かなりのサイド情報が必要である。音の成分選択は、非常に単純で、非音成分の間で多くのピークを選択する。
非特許文献2に記載の方法は、デコーダ側でルックアヘッドを必要とするので、1つのフレーム分の追加の遅延を導入する。ピーク検出のために平滑化された擬似パワースペクトルを使用することで、ピークの場所の精度が減じられる。1つのフレームのみに現れる雑音からピークを検出することになるので、検出の信頼性も低下する。
非特許文献4に記載の方法は、デコーダ側でルックアヘッドを必要とするので、2つのフレーム分の追加の遅延を導入する。音の成分の選択は、2つのフレームにおいて音の成分を別々にチェックせず、平均化されたスペクトルに依拠するため、フォルスポジティブまたはフォルスネガティブのいずれかが多くなりすぎて、ピーク検出閾値を調節することが不可能になる。ピークの場所は、擬似パワースペクトルを使用するので正確にならない。ピークサーチのための制限されたスペクトル域は、擬似パワースペクトルを使用するために生じる上記の問題のための予備手段のように見える。
非特許文献5に記載の方法は、非特許文献4に記載の方法に基づくので、同じ欠点を有し、追加の遅延が克服されるに過ぎない。
Figure 2016526703
特許文献5において、3つ以上の前のフレームをメモリにストアする必要があり、したがってメモリの要件がかなり上げられる。音の封じ込めを使用するかどうかの判断は、誤りの可能性があり、1以上の高調波を有するフレームは、複数の高調波を有していないフレームとして分類され得る。最後に受信したMDCTフレームは、損失MDCTスペクトルの予測を改善するために直接的に使用されないが、音の成分のサーチにおいてのみ使用される。しかしながら、高調波について封じ込められるべきMDCT係数の数がノイズレベルに依拠して固定されており、1つの高調波を構成する可変な数のMDCT係数を有することが望ましい。
以下では、本発明の実施形態について、添付の図面を参照しながらより詳細に説明する。
図1は、デコーダ側で本発明のアプローチを実現するオーディオ信号を送信するためのシステムの簡略化されたブロック図である。 図2は、ある実施形態による本発明のアプローチのフロー図である。 図3は、隣接するフレームについて重なるMDCT窓の模式図である。 図4は、ある実施形態によるピークを取るためのステップを表すフロー図である。 図5は、1以上のピークが検出されるフレームのパワースペクトルの模式図である。 図6は、「間のフレーム」のための例を示す図である。 図7は、送信されるサイド情報なしの内挿アプローチを表すブロック図である。 図8は、図7に比べて精査されたFLC技術全体のブロック図である。
なお、以下に本発明のアプローチの実施形態についてより詳細に説明するが、添付の図面において、同じまたは類似の機能性を有する要素は同じ参照記号で示す。以下に、本発明のアプローチの実施形態について記載するが、これらの実施形態によれば、受信した最後の2つのフレームがMDCTを用いて符号化される場合にのみ、周波数領域において封じ込めが行われる。2つのMDCTフレームを受信した後のフレーム損失に対して時間領域かまたは周波数領域の封じ込めのいずれを用いるかの判断に関する詳細も説明する。なお、以下に記載の実施形態に関しては、切替コーデックでは、周波数領域は、定常の音の信号について使用されるので、最後の2つのフレームが周波数領域で符号化されると言う要件が、本発明のアプローチの適用性を狭めるということはない。
図1は、デコーダ側で本発明のアプローチを実現するオーディオ信号を送信するためのシステムの簡略化されたブロック図である。このシステムは、入力102において、オーディオ信号104を受信するエンコーダ100を含む。エンコーダは、受信したオーディオ信号104に基づいて、エンコーダ100の出力106に付与される符号化オーディオ信号を生成するよう構成される。エンコーダは、オーディオ信号のフレームがMDCTを用いて符号化されるように、符号化オーディオ信号を供給し得る。ある実施形態によれば、エンコーダ100は、参照番号110で示すように、オーディオ信号の無線送信を図るためのアンテナ108を含む。他の実施形態では、エンコーダは、たとえば参照記号112で示すように、有線接続ラインを介して出力106に付与される符号化オーディオ信号を出力し得る。
このシステムは、エンコーダ106により付与される符号化オーディオ信号が受信される入力122を有するデコーダ120をさらに含む。ある実施形態によれば、エンコーダ120は、エンコーダ100からの無線送信110を受信するためのアンテナ124を含み得る。他の実施形態では、入力122は、符号化オーディオ信号を受信するための有線送信112への接続を提供し得る。デコーダ120の入力122で受信されたオーディオ信号は、デコーダ120によって復号されるべき受信されたオーディオ信号の符号化されたフレームを置換する必要があるかどうかを決定する検出器126へ付与される。たとえば、ある実施形態によれば、検出器126が、前のフレームに追随すべきフレームが、デコーダで受信されていないと決定するか、または受信フレームが、デコーダ側120での復号化を回避するエラーを有すると決定される場合などが、これに当たる。復号化のために提示されたフレームが入手可能であると検出器126で決定される場合、このフレームは、デコーダ130の出力において、復号されたオーディオフレームのストリームまたは復号化されたオーディオ信号132を出力できるように、符号化フレームの復号化が行われる復号化ブロック128へ転送される。
現在処理対象のフレームは、置換が必要であるとブロック126で決定される場合、置換が必要でかつ検出器回路126でバッファされ得る現在のフレームに先行するフレームを、音検出器134へ付与して、置換のスペクトルが、音の成分を含むかどうかを決定する。音の成分が付与されない場合には、ノイズ生成器または符号スクランブル等他の別の従来技術のノイズ発生方法を用いて生成され得る非予測係数であるスペクトル係数を生成するノイズ生成器/メモリブロック136へ、このことが示される。代替的には、スペクトルの非音の成分のための予め規定されたスペクトル係数も、ルックアップテーブル等のメモリから入手できる。代替的には、スペクトルが音の成分を含まないと決定された場合、非予測スペクトル係数を生成する代わりに、置換に先行するフレームのうちの1つのフレームの対応するスペクトル特性を選択してもよい。
音検出器134が、スペクトルが音の成分を含むことを検出した場合、それぞれの信号が、後述する本発明の実施形態によれば、置換フレームのためのスペクトル係数を予測する予測部138に対して示される。置換フレームについて決定されたそれぞれの係数が、復号化ブロック128へ付与され、そこで、これらのスペクトル係数に基づいて、損失または置換フレームの復号化が実行される。
図1に示すとおり、音検出器134、ノイズ生成器136および予測器138は、デコーダ120における置換フレーム用のスペクトル係数を得るための装置140を規定する。図示する要素は、適切にプログラムされた処理ユニット等のハードウェアおよび/またはソフトウェアコンポーネントを用いて実現することができる。
図2は、実施形態による本発明のアプローチのフロー図を示す。第1のステップS200において、図1に示すように、たとえば、デコーダ120で、符号化オーディオ信号が受信される。受信されたオーディオ信号は、MDCTを用いて符号化されたそれぞれのオーディオフレームの形式になり得る。
ステップS202において、デコーダ120によって処理されるべき現在のフレームが置換される必要があるか否かが決定される。デコーダ側で置換フレームが必要になり得るのは、受信したデータ等にエラーがあり、フレームが処理できないか、フレームが受信器/デコーダ120への送信中に失われたか、またはたとえばエンコーダ側からデコーダ側へのフレーム送信中の遅延によってオーディオ信号受信機120でのフレームの受信が間に合わなかった場合等である。
ステップ202において、たとえばデコーダ120内の検出器126により、デコーダ120によって、現在処理対象のフレームは置換が必要であると決定されると、方法は、ステップS204へ進み、周波数領域封じ込めが必要か否かのさらなる決定が行われる。ある実施形態によれば、最後の2つの受信フレームについてピッチ情報が入手可能で、かつ、ピッチが変化しない場合には、ステップS204で、周波数領域封じ込めが望ましいと決定される。さもなければ、時間領域封じ込めが適用されるべきと決定される。代替的な実施形態では、ピッチは、復号化された信号および、ここでも、ピッチが存在し、サブフレームにおいて一定ならば、周波数領域封じ込めが使用され、それ以外では時間領域封じ込めが適用されるという決定を用いて、サブフレームごとに計算され得る。
本発明の他の実施形態では、たとえば、デコーダ120に検出器126等の検出器が設けられ、置換フレームに先行する最後から2番目のフレーム、最後のフレームまたはこれらのフレームの両方のスペクトルをさらに分析して、見つかったピークに基づいて、信号がモノラルかまたは多声かを決定するような態様で構成され得る。信号が多声である場合には、ピッチ情報の存在に関係なく、周波数領域封じ込めが使用されることになる。代替的には、デコーダ120における検出器126は、置換フレームに先行する1以上のフレームをさらに分析して、信号における音の成分の数が予め規定された閾値を超えるか否かを示すような態様で構成されてもよい。信号における音の成分の数が、閾値を超える場合には、周波数領域封じ込めが使用される。
ステップS204で、たとえば、上記の基準を適用して、周波数領域封じ込めが使用されることが決定される場合、方法は、ステップS206へ進み、オーディオ信号のスペクトルの音の部分または音の成分が、先行するフレームのスペクトルに存在する1以上のピーク、すなわち、置換フレームに先行する最後から2番目のフレームのスペクトルおよび最後のフレームのスペクトルにおいて実質的に同じ場所に存在する1以上のピークに基づいて検出される。ステップS208において、スペクトルの音の部分が存在するか否か決定される。スペクトルの音の部分が存在する場合には、方法は、ステップS210へ進み、たとえば、先行するフレーム、すなわち最後のフレームから2番目のフレームおよび最後のフレームから引き出せる情報に基づいて、置換フレームのスペクトルにおける1以上のピークおよびその周辺についての1以上のスペクトル係数が予測される。ステップS210で予測されるスペクトル係数(単数または複数)は、たとえば図1に示す復号化ブロック128へ転送され、それによりステップS212に示すように、ステップ210からのスペクトル係数に基づいて符号化オーディオ信号のフレームの復号化を実行することができる。
ステップS208において、スペクトルの音の部分が存在しないと決定されると、置換フレームについての非予測スペクトル係数または置換フレームに先行するフレームの対応のスペクトル係数を使用するステップS214へ進み、それらは、フレームを復号化するためのステップS212へ付与される。
ステップS204において、周波数領域封じ込めが望ましくないと決定される場合、方法は、ステップS216へ進み、置換されるフレームの従来技術による時間領域封じ込めが行われ、ステップS216におけるプロセスにより生成されるスペクトル係数に基づいて、符号化信号のフレームがステップS212で復号される。
ステップS202において、現在処理されるオーディオ信号に置換フレームがないと決定される場合、すなわち、現在処理されるフレームが、従来技術のアプローチを用いて完全に復号できる場合、方法は、符号化オーディオ信号のフレームを復号化するためのステップ212へ直接進む。
以下では、本発明の実施形態によるさらなる詳細について説明する。
<パワースペクトルの計算>
m−2のインデクスを付けた最後から2番目のフレームについて、MDST係数Sm-2を、復号された時間領域信号から直接計算する。
最後のフレームについては、最後に受信したフレームのMDCT係数Cm-1から計算される推定MDSTスペクトルを用いる(たとえば、非特許文献8を参照)。
Figure 2016526703
フレームm−2およびm−1のためのパワースペクトルは、以下のように計算される。
Figure 2016526703
ここで、
m-1(k)は、フレームm−1におけるMDST係数であり、Cm-1(k)は、フレームm−1におけるMDCT係数であり、Sm-2(k)は、フレームm−2におけるMDST係数であり、Cm-2(k)は、フレームm−2におけるMDCT係数である。
得られたパワースペクトルは、以下のとおり平滑化される。
Figure 2016526703
<音の成分の検出>
最後の2つのフレーム(m−2およびm−1)に存在するピークは、音の成分を表すものとして考えられる。ピークが連続して存在することで、音の成分とノイズ信号におけるランダムに発生するピークの区別ができる。
<ピッチ情報>
ピッチ情報が入手可能であると想定する。
・エンコーダ側で計算され、ビットストリームで得られるか、または
・デコーダ側で計算される。
ピッチ情報は、以下の条件のすべてが満たされた場合にのみ使用される。
・ピッチゲインがゼロより大きい。
・ピッチラグが、最後の2つのフレームにおいて一定である。
・基本周波数が100Hzより大きい。
基本周波数は、ピッチラグから計算される。
Figure 2016526703
N>5で、F’0=n・F0が存在する場合、スペクトルにおいて高調波が最強になり、F0は、F’0に設定される。高調波n・F0の位置に強いピークが十分に存在しない場合には、F0は、信頼できない。
ある実施形態によれば、ピッチ情報は、図3のMDCT窓の右側の境界に整列するフレーミングに対して計算される。この整列は、封じ込めを必要とする部分である重複領域300もピッチラグ計算に用いられるので、信号の音の部分の外挿には有益である。
他の実施形態では、ピッチ情報は、ビットストリームで転送され、かつ、クリーンなチャネルにおいてコーデックにより使用され得るので、封じ込めについて追加のコストなしで得られる。
<エンベロープ>
以下に、後述するピークピッキングに必要なスペクトルエンベロープを得るための手順を示す。
最後の2つのフレームにおける各パワースペクトルのエンベロープは、長さLの移動平均フィルタを用いて計算される。
Figure 2016526703
フィルタの長さは、基本周波数に依拠する(かつ範囲[7,23]に限定され得る)。
Figure 2016526703
LとF0のこの関係は、非特許文献9に記載の手順に類似するが、本発明においては、ルックアヘッドを含む現在のフレームからのピッチ情報が使用される一方、非特許文献9は、話者に特定的な平均ピッチを使用する。基本周波数が入手可能でないかまたは信頼できない場合には、フィルタの長さLは15に設定される。
<ピークピッキング>
ピークは、フレームm−1のパワースペクトルにおいて、予め規定された閾値に基づいてサーチされる。フレームm−1におけるピークの場所に基づいて、フレームm−2のパワースペクトルにおけるサーチのための閾値を適応させる。こうして、両方のフレーム(m−1およびm−2)に存在するピークが見つけられるが、正確な場所は、フレームm−2におけるパワースペクトルに基づく。この順序が重要なのは、フレームm−1におけるパワースペクトルが推定MDSTのみを用いて計算されるため、ピークの場所が正確でないためである。また、フレームm−2にのみ存在し、フレームm−1に存在しない音で継続することは望ましくないので、フレームm−1のMDCTが使用されることも重要である。図4は、実施形態によってピークをピッキングするための上記のステップを表すフロー図である。ステップS400において、1以上の予め規定された閾値に基づいて、置換フレームに先行する最後のフレームm−1のパワースペクトルにおいて、ピークのサーチが行われる。ステップS402において、1以上の閾値が適応される。ステップS404において、1以上の適応された閾値に基づいて置換フレームに先行する最後から2番目のフレームm−2のパワースペクトルにおいてピークがサーチされる。
図5は、1以上のピークが検出されるフレームのパワースペクトルを表す模式図である。図5において、上記のとおり決定されるか、または他の既知のアプローチにより決定され得るエンベロープ500が示される。図5において、円で表すいくつかのピーク候補が示される。ピーク候補からピークを見つけることについて以下により詳細に示す。図5は、偽ピーク504と共に見つかったピーク502およびノイズを表すピーク506示す。また、スペクトル係数の左足508と右足510が示される。
ある実施形態によれば、置換フレームに先行する最後のフレームm−1のパワースペクトルPm-1におけるピークは、以下のステップを用いて見つけられる(図4のステップS400)。
・以下の基準のすべてを満たす場合、スペクトル係数は、音のピーク候補として分類される。
・平滑化されたパワースペクトルとエンベロープ500との比が、ある閾値より大きい。
Figure 2016526703
・平滑化されたパワースペクトルとエンベロープ500との比が、周囲の隣接するものよりも大きい、すなわち極大値であることを意味する。
・スペクトル係数kの左足508および右足510を見つけ、かつ、左足508と右足510との間の最大値を見つけることにより、極大値が決定される。このステップは、図4で示すとおり必要とされ、偽ピーク504がサイドローブまたは量子化雑音により生じ得る。
最後から2番目のフレームm−2のパワースペクトルPm-2におけるピークのサーチのための閾値は、以下のとおり設定される(図4におけるステップS402)。
・Pm-1におけるインデクスiのピークの周辺のスペクトル係数において、以下のとおりである。
Figure 2016526703
・F0が入手可能であり、かつ、信頼できる場合、各∈[1,N]について、k=[n・F0]およびfrac=n・F0−kを設定する。
Figure 2016526703
m-1におけるインデクスiのピーク周辺でk∈[i−1,i+1]ならば、第1のステップで設定した閾値は、上書きされる。
・他のすべてのインデクスについて
Figure 2016526703
である。
最後から2番目のフレームm−2のパワースペクトルPm-2において、以下のステップによって音のピークが見つけられる(図4におけるステップS404)。
・以下が成り立つ場合、スペクトル係数は、音のピークとして分類される。すなわち
・パワースペクトルとエンベロープとの比が、閾値より大きい。
Figure 2016526703
・パワースペクトルとエンベロープとの比が、周りの隣接するものよりも大きい、すなわち極大値である。
・スペクトル係数kの左足508および右足510を見つけ、かつ、左足508と右足510との間の最大値を見つけることにより極大値を決定する。
・左足508および右足510は、音のピーク502の周辺、すなわち音の封じ込め法が用いられる音の成分のスペクトルビンも規定する。
上記の方法を用いることにより、図4において、右ピーク506がフレームの1つにのみ存在する、すなわち、フレームm−1とm−2の両方には存在しないことがわかる。したがって、このピークは、ノイズとしてマークされ、音の成分としては選択されない。
Figure 2016526703
Figure 2016526703
このように、位相シフトが存在し、ここで、lは、ピークのインデクスである。したがって、位相シフトが、入力周波数の端数部分+奇数スペクトル係数についてのπの付加的な加算に依拠する。
周波数Δlの端数部分は、たとえば非特許文献10に記載の方法を用いて得ることができる。
・サブバンドk=lにおける信号の大きさが極大値であるとすれば、Δlは、サブバンドk=l−1およびk=l+1における信号の大きさの比を計算することにより、すなわち、以下を評価することにより決定され得る。
Figure 2016526703
ここで、窓の振幅特性の近似が用いられる。
Figure 2016526703
ここで、bはメインローブの幅である。この式の定数Gは、推定の最大絶対誤差を最小化するために、27.4/20.0に調節されている。
・近似の周波数応答を置換し、かつ、以下のとおりなら
Figure 2016526703
次の式が導かれる。
Figure 2016526703
<MDCT予測>
すべてのスペクトルピークおよびそれらの周辺について、MDCT予測が用いられる。他のすべてのスペクトル係数について、符号スクランブルまたは同様のノイズ発生方法を用いることができる。
見つかったピークおよびそれらの周辺に属するすべてのスペクトル係数は、Kとして示される集合に属する。たとえば、図5において、ピーク502は、音の成分を表すピークとして識別された。ピーク502の周辺は、たとえば左足508と右足510との間のスペクトル係数+足508および510の係数等、予め規定された数の隣接するスペクトル係数により表すことができる。
実施形態によれば、ピークの周辺は、ピーク502の周りの予め規定された数の係数により規定される。ピークの周辺は、ピーク502の左の第1の数の係数およびピーク502の右の第2の数の係数を含み得る。ピーク502の左の係数の第1の数およびピーク502の右の係数の第2の数は、等しくてもよいし、異なっていてもよい。
EVS標準を適用する実施形態によれば、予め規定された数の隣接する係数が第1のステップにおいて、たとえば音の成分を検出する前に、設定されるか固定され得る。EVS標準においては、ピーク502から左の3つの係数、右の3つの係数およびピーク502、すなわち合計7つの係数が使用され得る(この数は、複雑性を理由に選択したが、他の数でも同様に作用する)。
実施形態によれば、ピークの周辺の大きさは、適応性がある。音の成分を表すとして識別されたピークの周辺は、2つのピークの周辺部が重ならないように修正され得る。実施形態によれば、ピークは、常に、その周辺部と共にのみ考慮され、これらは、共に音の成分を規定する。
失われたフレームにおけるMDCT係数の予測については、最後から2番目のフレームにおけるパワースペクトル(複素数スペクトルの大きさ)が使用される。
Figure 2016526703
置換フレームにおける失われたMDCT係数は、以下のとおり推定される。
Figure 2016526703
Figure 2016526703
<位相予測>
見つかったすべてのスペクトルについて、フラクショナル周波数Δlを上記のとおり計算し、かつ位相シフトは、以下のようになる。
Figure 2016526703
は、フレーム間の位相シフトである。これは、ピークおよびその周辺における係数について等しい。
ピーク位置およびその周辺部(k∈K)における各スペクトル係数のための位相が、以下の式を用いて最後から2番目に受信されたフレームにおいて計算される。
Figure 2016526703
失われたフレームにおける位相を以下のとおり予測する。
Figure 2016526703
Figure 2016526703
Figure 2016526703
ここで、は、フレームm−2におけるパワースペクトル(複素数スペクトルの大きさ)である。
このMDST推定および受信したMDCTから、フレームm−1における位相の推定値が以下のように得られる。
Figure 2016526703
推定位相を用いて、位相シフトを精査する。
Figure 2016526703
Figure 2016526703
損失フレームにおける位相は、以下のとおり予測される。
Figure 2016526703
この実施形態による位相シフトリファインメントにより、背景ノイズが存在する場合またはシヌソイドの周波数が変化する場合に、シヌソイドの予測が改善される。一定周波数で背景ノイズがない非重複シヌソイドについては、位相シフトは、ピーク周辺のMDCT係数のすべてについて同じである。
使用される封じ込めは、音の部分と、ノイズ部分とでは異なるフェードアウト速度を有し得る。信号の音の部分のフェードアウトスピードが、複数のフレーム損失後に、より遅ければ、音の部分が支配的になる。シヌソイド成分の様々な位相シフトによるシヌソイドの変動が、不快なアーチファクトを作り出す。
この問題を克服するため、実施形態によれば、第3の損失フレームからはじめて、ピーク(インデクスk)の位相差をその周辺の全スペクトル係数について使用する(k-lは、左足のインデクスであり、k+uは、右足のインデクスである)。
Figure 2016526703
他の実施形態によれば、遷移が提供される。第2の損失フレームにおける高い減衰を有するスペクトル係数は、ピークの位相差を使用し、小さい減衰の係数は、訂正された位相差を使用する。
Figure 2016526703
<大きさのリファインメント>
他の実施形態によれば、上記の位相シフトリファインメントを適用する代わりに、大きさのリファンメントを使用する他のアプローチを適用してもよい。
Figure 2016526703
ここで、lは、ピークのインデクスであり、フラクショナル周波数Δlを、上記のとおり計算する。位相シフトは、以下のとおりである。
Figure 2016526703
他の実施形態によれば、エネルギの増大を回避するため、精査した大きさは、最後から2番目の損失フレームからの大きさにより制限され得る。
Figure 2016526703
さらに他の実施形態によれば、大きさの減少を、それをフェードさせるために使用し得る。
Figure 2016526703
<「間のフレーム>を用いた位相予測>
置換フレームに先行するフレームについてのスペクトル係数の予測を基礎にする代わりに、他の実施形態では、位相予測に、「間のフレーム」(「中間」フレームとも呼ぶ)を使用し得る。図6は、「間のフレーム」の例を示す。図6において、置換フレームに先行する最後のフレーム600(m−1)、置換フレームに先行する最後から2番目のフレーム602(m−2)および間のフレーム604(m−1.5)が、関連のMDCT窓606〜610と共に示される。
MDCT窓の重複が50%未満の場合、損失フレームにより近いCMDCTスペクトルを得ることができる。図6においては、25%のMDCT窓重複の例を示す。これにより、MDCT窓606または608に等しく、ただしコーデックフレーミングからフレーム長さの半分だけシフトさせたダッシュで示す窓610を用いて、間のフレーム604(m−1.5)のCMDCTスペクトルを得ることができる。間のフレーム604(m−1.5)は、時間において損失フレーム(m)により近いので、そのスペクトル特性は、最後から2番目のフレーム602(m−2)と損失フレーム(m)との間のスペクトル特性よりも、損失フレーム(m)のスペクトル特性により類似することになる。
この実施形態では、MDST係数Sm-1.5およびMDCT係数Cm-1.5両方の計算を、MDSTおよびCMDCTを構成するMDCTで、復号された時間領域信号から直接的に行う。代替的には、CMDCTを、隣接する既存のMDCT係数からマトリックス演算を用いて得ることができる。
パワースペクトル計算を上記のように行い、音の成分の検出を、m−2番目のフレームをm−1.5番目のフレームで置換して上記のとおり行う。
Figure 2016526703
Figure 2016526703
Figure 2016526703
損失フレームにおけるMDCT係数の予測について、m−1.5フレームからの大きさを使用する。
Figure 2016526703
損失MDCT係数は、以下のとおり推定される。
Figure 2016526703
Figure 2016526703
Figure 2016526703
さらに、実施形態によれば、上記の位相シフトリファインメントを適用することができる。
Figure 2016526703
さらに、ピーク周辺の全スペクトル係数についての位相シフトからピークの位相シフトへの収束を上記のように用いることができる。
いくつかの態様について、装置に関連して説明したが、これらの態様が対応する方法の説明も表すことは明らかであり、その場合、ブロックまたは装置が方法ステップまたは方法ステップの特徴に相当する。同様に、方法ステップに関連して説明した態様も、対応の装置の対応のブロックもしくはアイテムまたは特徴の説明を表す。
特定の実装要件に依拠して、本発明の実施形態を、ハードウェアまたはソフトウェアで実装することができる。実装は、それぞれの方法が実行されるように、プログラマブルコンピュータシステムと協働する(または協働することができる)電子的に可読な制御信号を記憶した、フロッピー(登録商標)ディスク、DVD,ブルーレイ、CD,ROM,PROM,EPROM,EEPROMまたはフラッシュメモリ等のデジタル記憶媒体を用いて行うことができる。したがって、デジタル記憶媒体は、コンピュータ可読である。
本発明によるいくつかの実施形態は、本件明細書に記載の方法の1つを実行するように、プログラマブルコンピュータシステムと協働することができる、電子的に可読な制御信号を有するデータキャリアを含む。
一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実現することが可能で、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されると、方法の1つを実行するように動作する。プログラムコードは、たとえば、機械可読なキャリア上に記憶することができる。
他の実施形態は、機械可読なキャリア上に記憶される、本件明細書に記載の方法の1つを実行するためのコピュータプログラムを含む。
したがって、言い換えれば、本発明の方法の実施形態は、コンピュータプログラムがコンピュータ上で実行された時に、本件明細書に記載の方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
したがって、本発明の方法の他の実施形態は、本件明細書に記載の方法の1つを実行するためのコンピュータプログラムを記録するデータキャリア(またはデジタル記憶媒体またはコンピュータ可読媒体)である。
したがって、本発明の方法の他の実施形態は、本件明細書に記載の方法の1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、たとえば、インターネットを経由する等データ通信接続を経由して転送されるように構成され得る。
他の実施形態は、たとえば、本件明細書に記載の方法の1つを実行するよう構成または適合されたコンピュータまたはプログラマブル論理装置等の処理手段を含む。
他の実施形態は、本件明細書に記載の方法の1つを実行するためのコンピュータプログラムをインストールしたコンピュータを含む。
いくつかの実施形態において、プログラマブル論理装置(フィールドプログラマブルゲートアレイ等)を使用して、本件明細書に記載の方法の機能性の一部または全部を実行することができる。いくつかの実施形態では、フィールドプログラマブルゲートアレイが、本件明細書に記載の方法の1つを実行するために、マイクロプロセッサと協働し得る。一般に、方法は、なんらかのハードウェア装置により実行されることが好ましい。
上記の実施形態は、本発明の原則を説明するに過ぎない。当業者には、本件明細書に記載の構成および詳細の変形例および修正例が明らかになることは当然である。したがって、特許請求の範囲によってのみ限定され、本件明細書における実施形態の記載および説明により提示される特定の詳細によっては限定されないことを意図する。

Claims (39)

  1. オーディオ信号の置換フレームのためのスペクトル係数を得る方法であって、
    置換フレーム(m)に先行するフレーム(m−1、m−2)のスペクトルに存在するピーク(502)に基づいてオーディオ信号のスペクトルの音の成分を検出するステップ(S206)と、
    スペクトルの音の成分について、置換フレーム(m)のスペクトルにおけるピーク(502)およびその周辺についてスペクトル係数を予測するステップ(S210)と、
    スペクトルの非音の成分について、置換フレーム(m)のための非予測スペクトル係数または置換フレーム(m)に先行するフレームの対応するスペクトル係数を使用するステップ(S214)とを含む、方法。
  2. 置換フレーム(m)のスペクトルにおけるピーク(502)およびその周辺についてのスペクトル係数が、置換フレーム(m)に先行するフレーム(m−2)の複素数スペクトルの大きさおよび置換フレーム(m)の複素数スペクトルの予測位相に基づいて予測され、かつ
    置換フレーム(m)の複素数スペクトルの位相が、置換フレーム(m)に先行するフレーム(m−2)の複素数スペクトルの位相および置換フレーム(m)に先行するフレーム(m−1、m−2)間の位相シフトに基づいて予測される、請求項1に記載の方法。
  3. 置換フレーム(m)のスペクトルにおけるピーク(502)およびその周辺についてのスペクトル係数が、置換フレーム(m)に先行する最後から2番目のフレーム(m−2)の複素数スペクトルの大きさおよび置換フレーム(m)の複素数スペクトルの予測位相に基づいて予測され、かつ
    置換フレーム(m)の複素数スペクトルの位相が、置換フレーム(m)に先行する最後から2番目のフレーム(m−2)の複素数スペクトルに基づいて予測される、請求項2に記載の方法。
  4. 置換フレーム(m)の複素数スペクトルの位相が、置換フレーム(m)に先行するフレーム(m−2)におけるピークおよびその周辺の各スペクトル係数についての位相に基づいて予測される、請求項2または請求項3に記載の方法。
  5. 置換フレーム(m)に先行するフレーム(m−1、m−2)間の位相シフトが、それぞれのフレームにおけるピークとその周辺における各スペクトル係数について等しい、請求項2から請求項4のいずれか1項に記載の方法。
  6. 音の成分がピークおよびその周辺により規定される、請求項1から請求項5のいずれか1項に記載の方法。
  7. ピークの周辺は、ピーク(502)の周りの予め規定された数の係数により規定される、請求項1から請求項6のいずれか1項に記載の方法。
  8. ピークの周辺は、ピーク(502)の左側の第1の数の係数およびピーク(502)の右側の第2の数の係数を含む、請求項1から請求項7のいずれか1項に記載の方法。
  9. 第1の数の係数が、左足(508)とピーク(502)の間の係数+左足(508)の係数を含み、第2の数の係数が、右足(510)とピーク(502)の間の係数+右足(510)の係数を含む、請求項8に記載の方法。
  10. ピーク(502)から左の係数の第1の数と、ピーク(502)から右の係数の第2の数が等しいかまたは異なる、請求項8または請求項9に記載の方法。
  11. ピーク(502)から左の係数の第1の数が3であり、かつピーク(502)から右の係数の第2の数が3である、請求項10に記載の方法。
  12. ピーク(502)の周りの予め規定された数の係数が、音の成分を検出するステップに先立って設定される、請求項6から請求項11のいずれか1項に記載の方法。
  13. ピークの周辺の大きさは、適応性がある、請求項1から請求項12のいずれか1項に記載の方法。
  14. ピークの周辺が、2つのピークのまわりの周辺が重複しないように選択される、請求項13に記載の方法。
  15. 置換フレーム(m)のスペクトルにおけるピーク(502)およびその周辺についてのスペクトル係数が、置換フレーム(m)に先行する最後から2番目のフレーム(m−2)の複素数スペクトルの大きさおよび置換フレーム(m)の複素数スペクトルの予測される位相に基づいて予測され、
    置換フレーム(m)の複素数スペクトルの位相が、置換フレーム(m)に先行する最後のフレーム(m−1)の複素数スペクトルの位相および置換フレーム(m)に先行する最後のフレーム(m−1)と最後から2番目のフレーム(m−2)との間の精査された位相シフトに基づいて予測され、
    置換フレーム(m)に先行する最後のフレーム(m−1)の複素数スペクトルの位相が、置換フレーム(m)に先行する最後から2番目のフレーム(m−2)の複素数スペクトルの大きさ、置換フレーム(m)に先行する最後から2番目のフレーム(m−2)の複素数スペクトルの位相、置換フレーム(m)に先行する最後のフレーム(m−1)と最後から2番目のフレーム(m−2)との間の位相シフトおよび最後のフレーム(m−1)の実スペクトルに基づいて決定され、かつ
    精査された位相シフトが、置換フレーム(m)に先行する最後のフレーム(m−1)の複素数スペクトルの位相と置換フレーム(m)に先行する最後から2番目のフレーム(m−2)の複素数スペクトルの位相とに基づいて決定される、請求項2に記載の方法。
  16. 位相シフトの精査が、連続的な損失フレームの数に基づいて適応され得る、請求項15に記載の方法。
  17. 第3の損失フレームからはじめて、ピークについて決定される位相フレームを、ピーク(502)の周囲のスペクトル係数を予測するために使用する、請求項16に記載の方法。
  18. 置換フレーム(m)に先行する最後のフレーム(m−1)における位相シフトが、予め規定された閾値以下である場合、第2の損失フレームにおいてスペクトル係数を予測するために、ピーク(502)について決定された位相シフトを、周辺のスペクトル係数についてスペクトル係数を予測するために使用し、かつ置換フレーム(m)に先行する最後のフレーム(m−1)における位相シフトが、予め規定された閾値を上回る場合、それぞれの周辺のスペクトル係数について決定された位相シフトを、周辺のスペクトル係数のスペクトル係数を予測するために使用する、請求項17に記載の方法。
  19. 置換フレーム(m)のスペクトルにおけるピーク(502)およびその周辺についてのスペクトル係数が、置換フレーム(m)に先行する最後のフレーム(m−1)の複素数スペクトルの精査された大きさと、置換フレーム(m)の複素数スペクトルの予測される位相とに基づいて予測され、かつ
    置換フレーム(m)の複素数スペクトルの位相が、置換フレーム(m)に先行する最後から2番目のフレーム(m−2)の複素数スペクトルの位相および置換フレーム(m)に先行する最後のフレーム(m−1)と最後から2番目のフレーム(m−2)との間の位相シフトの2倍に基づいて予測される、請求項2に記載の方法。
  20. 置換フレーム(m)に先行する最後のフレーム(m−1)の複素数スペクトルの精査された大きさが、置換フレーム(m)に先行する最後のフレーム(m−1)の実スペクトルの実スペクトル係数、置換フレーム(m)に先行する最後から2番目のフレーム(m−2)の複素数スペクトルの位相および置換フレーム(m)に先行する最後のフレーム(m−1)と最後から2番目のフレーム(m−2)との間の位相シフトに基づいて決定される、請求項19に記載の方法。
  21. 置換フレーム(m)に先行する最後のフレーム(m−1)の複素数スペクトルの精査された大きさが、置換フレーム(m)に先行する最後から2番目のフレーム(m−2)の複素数スペクトルの大きさにより制限される、請求項19または請求項20に記載の方法。
  22. 置換フレーム(m)のスペクトルにおけるピーク(502)およびその周辺ついてのスペクトル係数が、置換フレーム(m)に先行する最後のフレーム(m−1)と最後から2番目のフレーム(m−2)との間の中間フレームの複素数スペクトルの大きさおよび置換フレーム(m)の複素数スペクトルの予測される位相に基づいて予測される、請求項2に記載の方法。
  23. 置換フレーム(m)の複素数スペクトルの位相が、置換フレーム(m)に先行する中間フレームの複素数スペクトルの位相および置換フレーム(m)に先行する中間フレーム間の位相シフトに基づいて予測され、または
    置換フレーム(m)の複素数スペクトルの位相が、置換フレーム(m)に先行する最後のフレーム(m−1)の複素数スペクトルの位相および置換フレーム(m)に先行する中間フレーム間の精査された位相シフトに基づき予測され、精査された位相シフトが、置換フレーム(m)に先行する最後のフレーム(m−1)の複素数スペクトルの位相および置換フレーム(m)に先行する中間フレームの複素数スペクトルの位相に基づいて決定される、請求項22に記載の方法。
  24. オーディオ信号のスペクトルの音の成分を検出するステップが、
    1以上の予め規定された閾値に基づいて、置換フレーム(m)に先行する最後のフレーム(m−1)のスペクトルにおけるピークをサーチするステップ(S400)と、
    1以上の閾値を適応させるステップ(S402)と、
    1以上の適応された閾値に基づいて、置換フレーム(m)に先行する最後から2番目のフレーム(m−2)のスペクトルにおけるピークをサーチするステップ(S404)とを含む、請求項1から請求項23のいずれか1項に記載の方法。
  25. 1以上の閾値を適応させるステップが、置換フレーム(m)に先行する最後のフレーム(m−1)のスペクトルおよびスペクトルエンベロープに基づくかまたは基本周波数に基づいて、置換フレーム(m)に先行する最後のフレーム(m−1)において見つかったピーク周辺の領域において、置換フレーム(m)に先行する最後から2番目のフレーム(m−2)におけるピークをサーチするための1以上の閾値を設定するステップを含む、請求項24に記載の方法。
  26. 基本周波数が、置換フレーム(m)に先行する最後のフレーム(m−1)および置換フレーム(m)に先行する最後のフレーム(m−1)のルックアヘッドを含む信号についてのものである、請求項25に記載の方法。
  27. 置換フレーム(m)に先行する最後のフレーム(m−1)のルックアヘッドが、ルックアヘッドを用いてエンコーダ側で計算される、請求項26に記載の方法。
  28. 1以上の閾値を適用させるステップ(S402)が、置換フレーム(m)に先行する最後のフレーム(m−1)において見つかったピークの周辺ではない領域において、置換フレーム(m)に先行する最後から2番目のフレーム(m−2)におけるピークをサーチするための1以上の閾値を、予め規定された閾値に設定するステップを含む、請求項24から請求項27のいずれか1項に記載の方法。
  29. 置換フレーム(m)について、オーディオ信号の音の成分のスペクトル係数の予測を用いて、時間領域封じ込めまたは周波数領域封じ込めを適用するかを決定するステップ(S204)をさらに含む、請求項1から請求項28のいずれか1項に記載の方法。
  30. 置換フレーム(m)に先行する最後のフレーム(m−1)および置換フレーム(m)に先行する最後から2番目のフレーム(m−2)が、一定のピッチを有するか、または置換フレーム(m)に先行する1以上のフレームの分析が、信号における音の成分の数が予め規定された閾値を超えることを示す場合、周波数領域封じ込めが適用される、請求項29に記載の方法。
  31. オーディオ信号のフレームが、MDCTを用いて符号化される、請求項1から請求項30のいずれか1項に記載の方法。
  32. 置換フレーム(m)が、受信データにおけるエラー等のせいで、オーディオ信号受信機で処理できないフレーム、オーディオ信号受信機への送信中に失われたフレーム、またはオーディオ信号受信機で受信が間に合わなかったフレームを含む、請求項1から請求項31のいずれか1項に記載の方法。
  33. 符号スクランブル等の雑音発生方法またはルックアップテーブル等のメモリからの予め規定されたスペクトル係数を用いて、非予測スペクトル係数が生成される、請求項1から請求項32のいずれか1項に記載の方法。
  34. コンピュータで実行されると、請求項1から請求項33のいずれか1項に記載の方法を実行する命令を記憶するコンピュータ可読媒体を含む非一時的コンピュータプログラム製品。
  35. オーディオ信号の置換フレーム(m)のためのスペクトル係数を得るための装置であって、
    置換フレーム(m)に先行するフレームのスペクトルにおいて存在するピークに基づいてオーディオ信号のスペクトルの音の成分を検出するよう構成される検出器(134)と、
    置換フレーム(m)のスペクトルにおけるピーク(502)およびその周辺についてのスペクトル係数を、スペクトルの音の成分について予測するよう構成される予測器(138)とを含み、
    スペクトルの非音の成分について、置換フレーム(m)の非予測スペクトル係数または置換フレーム(m)に先行するフレームの対応するスペクトル係数が使用される、装置。
  36. オーディオ信号の置換フレーム(m)のためのスペクトル係数を得るための装置であって、請求項1から請求項33のいずれか1項に記載の方法に従って動作するよう構成される、装置。
  37. 請求項35または請求項36に記載の装置を含むオーディオデコーダ。
  38. 請求項37に記載のオーディオデコーダを含むオーディオ受信機。
  39. オーディオ信号を送信するためのシステムであって、
    符号化されたオーディオ信号を生成するよう構成されるエンコーダ(100)と、
    符号化されたオーディオ信号を受信し、かつ符号化されたオーディオ信号を復号するよう構成される請求項37に記載のデコーダ(120)とを含む、システム。
JP2016520514A 2013-06-21 2014-06-20 オーディオ信号の置換フレームのためのスペクトル係数を得るための方法および装置、オーディオデコーダ、オーディオ受信機ならびにオーディオ信号を送信するためのシステム Active JP6248190B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP13173161 2013-06-21
EP13173161.4 2013-06-21
EP14167072.9 2014-05-05
EP14167072 2014-05-05
PCT/EP2014/063058 WO2014202770A1 (en) 2013-06-21 2014-06-20 Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals

Publications (2)

Publication Number Publication Date
JP2016526703A true JP2016526703A (ja) 2016-09-05
JP6248190B2 JP6248190B2 (ja) 2017-12-13

Family

ID=50980298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016520514A Active JP6248190B2 (ja) 2013-06-21 2014-06-20 オーディオ信号の置換フレームのためのスペクトル係数を得るための方法および装置、オーディオデコーダ、オーディオ受信機ならびにオーディオ信号を送信するためのシステム

Country Status (18)

Country Link
US (3) US9916834B2 (ja)
EP (1) EP3011556B1 (ja)
JP (1) JP6248190B2 (ja)
KR (1) KR101757338B1 (ja)
CN (2) CN105408956B (ja)
AU (1) AU2014283180B2 (ja)
BR (1) BR112015032013B1 (ja)
CA (1) CA2915437C (ja)
ES (1) ES2633968T3 (ja)
HK (1) HK1224075A1 (ja)
MX (1) MX352099B (ja)
MY (1) MY169132A (ja)
PL (1) PL3011556T3 (ja)
PT (1) PT3011556T (ja)
RU (1) RU2632585C2 (ja)
SG (1) SG11201510513WA (ja)
TW (1) TWI562135B (ja)
WO (1) WO2014202770A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022521494A (ja) * 2019-02-21 2022-04-08 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 位相ecu f0補間スプリットのための方法および関係するコントローラ

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX352099B (es) * 2013-06-21 2017-11-08 Fraunhofer Ges Forschung Método y aparato para obtener coeficientes de espectro para un cuadro de reemplazo de una señal de audio, decodificador de audio, receptor de audio y sistema para transmitir señales de audio.
CN112967727A (zh) 2014-12-09 2021-06-15 杜比国际公司 Mdct域错误掩盖
TWI576834B (zh) * 2015-03-02 2017-04-01 聯詠科技股份有限公司 聲頻訊號的雜訊偵測方法與裝置
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US10504525B2 (en) 2015-10-10 2019-12-10 Dolby Laboratories Licensing Corporation Adaptive forward error correction redundant payload generation
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
EP3246923A1 (en) * 2016-05-20 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a multichannel audio signal
CN106101925B (zh) * 2016-06-27 2020-02-21 联想(北京)有限公司 一种控制方法及电子设备
KR102569784B1 (ko) * 2016-09-09 2023-08-22 디티에스, 인코포레이티드 오디오 코덱의 장기 예측을 위한 시스템 및 방법
RU2652434C2 (ru) * 2016-10-03 2018-04-26 Виктор Петрович Шилов Способ приемопередачи дискретных информационных сигналов
CN106533394B (zh) * 2016-11-11 2019-01-04 江西师范大学 一种基于自适应滤波器幅频响应的高精度频率估计方法
EP3800636B1 (en) * 2017-09-12 2023-03-08 Dolby Laboratories Licensing Corporation Packet loss concealment for critically-sampled filter bank-based codecs using multi-sinusoidal detection
JP6907859B2 (ja) * 2017-09-25 2021-07-21 富士通株式会社 音声処理プログラム、音声処理方法および音声処理装置
CN108055087B (zh) * 2017-12-30 2024-04-02 天津大学 利用长肢领航鲸叫声谐波数量进行编码的通信方法及装置
US10186247B1 (en) * 2018-03-13 2019-01-22 The Nielsen Company (Us), Llc Methods and apparatus to extract a pitch-independent timbre attribute from a media signal
CN113129910B (zh) * 2019-12-31 2024-07-30 华为技术有限公司 音频信号的编解码方法和编解码装置
CN113111618B (zh) * 2021-03-09 2022-10-18 电子科技大学 一种基于改进的经验小波变换的模拟电路故障诊断方法
CN113655529B (zh) * 2021-08-17 2022-11-29 南京航空航天大学 一种针对高采样率的被动磁信号优化提取和检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004504637A (ja) * 2000-07-14 2004-02-12 コネクサント システムズ, インコーポレイテッド 紛失フレームを取扱うための音声通信システムおよび方法
JP2015527765A (ja) * 2012-06-08 2015-09-17 サムスン エレクトロニクス カンパニー リミテッド フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2130952A5 (ja) * 1971-03-26 1972-11-10 Thomson Csf
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
FR2692091B1 (fr) 1992-06-03 1995-04-14 France Telecom Procédé et dispositif de dissimulation d'erreurs de transmission de signaux audio-numériques codés par transformée fréquentielle.
JP3328532B2 (ja) * 1997-01-22 2002-09-24 シャープ株式会社 デジタルデータの符号化方法
US6351730B2 (en) * 1998-03-30 2002-02-26 Lucent Technologies Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6496797B1 (en) * 1999-04-01 2002-12-17 Lg Electronics Inc. Apparatus and method of speech coding and decoding using multiple frames
WO2000060575A1 (en) * 1999-04-05 2000-10-12 Hughes Electronics Corporation A voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US7447639B2 (en) * 2001-01-24 2008-11-04 Nokia Corporation System and method for error concealment in digital audio transmission
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US7356748B2 (en) 2003-12-19 2008-04-08 Telefonaktiebolaget Lm Ericsson (Publ) Partial spectral loss concealment in transform codecs
CN1930607B (zh) * 2004-03-05 2010-11-10 松下电器产业株式会社 差错隐藏装置以及差错隐藏方法
CN1989548B (zh) * 2004-07-20 2010-12-08 松下电器产业株式会社 语音解码装置及补偿帧生成方法
US8620644B2 (en) 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
KR100770839B1 (ko) * 2006-04-04 2007-10-26 삼성전자주식회사 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치
EP2054876B1 (en) * 2006-08-15 2011-10-26 Broadcom Corporation Packet loss concealment for sub-band predictive coding based on extrapolation of full-band audio waveform
KR100788706B1 (ko) * 2006-11-28 2007-12-26 삼성전자주식회사 광대역 음성 신호의 부호화/복호화 방법
KR101291193B1 (ko) * 2006-11-30 2013-07-31 삼성전자주식회사 프레임 오류은닉방법
US8935158B2 (en) * 2006-12-13 2015-01-13 Samsung Electronics Co., Ltd. Apparatus and method for comparing frames using spectral information of audio signal
US8990073B2 (en) * 2007-06-22 2015-03-24 Voiceage Corporation Method and device for sound activity detection and sound signal classification
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8489396B2 (en) * 2007-07-25 2013-07-16 Qnx Software Systems Limited Noise reduction with integrated tonal noise reduction
US8428957B2 (en) * 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
CA2871268C (en) * 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
EP4407610A1 (en) * 2008-07-11 2024-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
CN101521012B (zh) * 2009-04-08 2011-12-28 武汉大学 Mdct域信号能量与相位补偿方法及其装置
CN101958119B (zh) * 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
CA2777073C (en) * 2009-10-08 2015-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping
WO2011048117A1 (en) * 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
BR112013026452B1 (pt) * 2012-01-20 2021-02-17 Fraunhofer-Gellschaft Zur Förderung Der Angewandten Forschung E.V. aparelho e método para codificação e decodificação de áudio empregando substituição sinusoidal
KR20150056770A (ko) * 2012-09-13 2015-05-27 엘지전자 주식회사 손실 프레임 복원 방법 및 오디오 복호화 방법과 이를 이용하는 장치
US9401153B2 (en) * 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding
WO2014123469A1 (en) * 2013-02-05 2014-08-14 Telefonaktiebolaget L M Ericsson (Publ) Enhanced audio frame loss concealment
HUE030163T2 (en) * 2013-02-13 2017-04-28 ERICSSON TELEFON AB L M (publ) Hide frame failure
MX352099B (es) * 2013-06-21 2017-11-08 Fraunhofer Ges Forschung Método y aparato para obtener coeficientes de espectro para un cuadro de reemplazo de una señal de audio, decodificador de audio, receptor de audio y sistema para transmitir señales de audio.

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004504637A (ja) * 2000-07-14 2004-02-12 コネクサント システムズ, インコーポレイテッド 紛失フレームを取扱うための音声通信システムおよび方法
JP2015527765A (ja) * 2012-06-08 2015-09-17 サムスン エレクトロニクス カンパニー リミテッド フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022521494A (ja) * 2019-02-21 2022-04-08 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 位相ecu f0補間スプリットのための方法および関係するコントローラ
JP7178506B2 (ja) 2019-02-21 2022-11-25 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 位相ecu f0補間スプリットのための方法および関係するコントローラ
US11705136B2 (en) 2019-02-21 2023-07-18 Telefonaktiebolaget Lm Ericsson Methods for phase ECU F0 interpolation split and related controller
US12002477B2 (en) 2019-02-21 2024-06-04 Telefonaktiebolaget Lm Ericsson (Publ) Methods for phase ECU F0 interpolation split and related controller

Also Published As

Publication number Publication date
CA2915437C (en) 2017-11-28
CN105408956B (zh) 2020-03-27
AU2014283180B2 (en) 2017-01-05
SG11201510513WA (en) 2016-01-28
US9916834B2 (en) 2018-03-13
BR112015032013A2 (pt) 2017-07-25
EP3011556A1 (en) 2016-04-27
US11282529B2 (en) 2022-03-22
US20160104490A1 (en) 2016-04-14
EP3011556B1 (en) 2017-05-03
CN111627451B (zh) 2023-11-03
MY169132A (en) 2019-02-18
HK1224075A1 (zh) 2017-08-11
CA2915437A1 (en) 2014-12-24
AU2014283180A1 (en) 2016-02-11
MX352099B (es) 2017-11-08
CN105408956A (zh) 2016-03-16
KR20160024918A (ko) 2016-03-07
TWI562135B (en) 2016-12-11
RU2016101336A (ru) 2017-07-26
JP6248190B2 (ja) 2017-12-13
KR101757338B1 (ko) 2017-07-26
BR112015032013B1 (pt) 2021-02-23
TW201506908A (zh) 2015-02-16
US20200020343A1 (en) 2020-01-16
PT3011556T (pt) 2017-07-13
US10475455B2 (en) 2019-11-12
US20180108361A1 (en) 2018-04-19
RU2632585C2 (ru) 2017-10-06
ES2633968T3 (es) 2017-09-26
PL3011556T3 (pl) 2017-10-31
CN111627451A (zh) 2020-09-04
WO2014202770A1 (en) 2014-12-24
MX2015017369A (es) 2016-04-06

Similar Documents

Publication Publication Date Title
JP6248190B2 (ja) オーディオ信号の置換フレームのためのスペクトル係数を得るための方法および装置、オーディオデコーダ、オーディオ受信機ならびにオーディオ信号を送信するためのシステム
JP5025485B2 (ja) ステレオ符号化装置およびステレオ信号予測方法
JP6178304B2 (ja) 量子化装置
EP3058566B1 (en) Coding of spectral coefficients of a spectrum of an audio signal
JP5978218B2 (ja) 低ビットレート低遅延の一般オーディオ信号の符号化
JP4290917B2 (ja) 復号装置、符号化装置、復号方法、及び、符号化方法
CN101842832B (zh) 编码装置和解码装置
KR101412115B1 (ko) 비트 스트림 도메인 내의 코딩된 오디오 프레임들의 레벨 추정을 위한 장치 및 방법
Lecomte et al. Packet-loss concealment technology advances in EVS
JP2017506771A (ja) 信号符号化方法及びその装置、並びに信号復号方法及びその装置
US9093068B2 (en) Method and apparatus for processing an audio signal
Ryu et al. An mdct domain frame-loss concealment technique for mpeg advanced audio coding
KR102424897B1 (ko) 상이한 손실 은닉 도구들의 세트를 지원하는 오디오 디코더
US20120284020A1 (en) System and method of speech compression using an inter frame parameter correlation
JP5182112B2 (ja) デコード装置および音声符号化方式推定方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170209

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20170508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170725

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171002

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171024

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171120

R150 Certificate of patent or registration of utility model

Ref document number: 6248190

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250