JP7307805B2 - 周波数領域パケットロス補償のための方法、および関連デコーダ - Google Patents

周波数領域パケットロス補償のための方法、および関連デコーダ Download PDF

Info

Publication number
JP7307805B2
JP7307805B2 JP2021547688A JP2021547688A JP7307805B2 JP 7307805 B2 JP7307805 B2 JP 7307805B2 JP 2021547688 A JP2021547688 A JP 2021547688A JP 2021547688 A JP2021547688 A JP 2021547688A JP 7307805 B2 JP7307805 B2 JP 7307805B2
Authority
JP
Japan
Prior art keywords
audio signal
decoder
buffer
segment
reconstructed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021547688A
Other languages
English (en)
Other versions
JPWO2020169756A5 (ja
JP2022521077A (ja
Inventor
マルティン セールステッド,
ヨナス スヴェドベリ,
Original Assignee
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エルエム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Publication of JP2022521077A publication Critical patent/JP2022521077A/ja
Publication of JPWO2020169756A5 publication Critical patent/JPWO2020169756A5/ja
Priority to JP2023107640A priority Critical patent/JP2023138988A/ja
Application granted granted Critical
Publication of JP7307805B2 publication Critical patent/JP7307805B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • G06F17/142Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Discrete Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Communication Control (AREA)

Description

本開示は、一般的に、受信されたオーディオ信号と関連付けられた消失したオーディオフレームを補償(コンシール)するために分析窓長を充填するための方法に関する。本開示はまた、受信されたオーディオ信号と関連付けられた消失したオーディオフレームを補償するために分析窓長を充填するように設定されるデコーダに関する。
現代の通信チャネル/ネットワークでの音声/オーディオの伝送は、音声/オーディオコーデックを使用してデジタル領域で主に行われる。これは、アナログ信号を取り込み、かつこれを、サンプリングおよびアナログ-デジタル変換器(ADC)を使用してデジタル化してデジタルサンプルを得ることを伴う場合がある。これらのデジタルサンプルは、アプリケーションに応じて10~40msの連続した期間からサンプルを含むフレームにさらにグループ化可能である。これらのフレームはさらにまた、圧縮アルゴリズムを使用して処理されてよく、これによって、送信される必要があるビット数が低減され、かつ依然できるだけ高い品質が実現可能である。符号化されたビットストリームはさらにまた、データパケットとしてデジタルネットワークで受信側に送信される。受信側ではプロセスは逆にされる。データパケットは最初、復号されてデジタルサンプルでフレームを再現してよく、その後、デジタル-アナログ変換器(DAC)に入力されて、入力されたアナログ信号の近似を受信側で再現することができる。図1では、上述されたアプローチを使用して、デジタルネットワークなどのネットワーク上でのオーディオエンコーダおよびデコーダを使用したオーディオ転送のブロック図の一例が提供される。
データパケットがネットワーク上で送信される時、トラフィック負荷によりネットワークによって廃棄され得る、またはデジタルデータの復号を無効にするビットエラーの結果として廃棄され得るデータパケットがあり得る。これらのイベントが発生する時、デコーダは、実際の復号を行うことが不可能である期間に出力された信号を置き換える必要がある。この置換プロセスは典型的には、フレーム/パケットロス補償(PLC:packet loss concealment)と呼ばれる。図2は、パケットロス補償を含むデコーダ200のブロック図を示す。不良フレームインジケータ(BFI:Bad Frame Indicator)が消失したまたは壊れたフレームを指示する時、PLC202は消失した/壊れたフレームを置き換えるための信号を生じさせてよい。その他の場合、すなわち、BFIが消失したまたは壊れたフレームを指示しない時、受信された信号はストリームデコーダ204によって復号される。フレーム消去は、現在のフレーム用の不良フレームインジケータ変数をアクティブに設定すること、すなわち、BFI=1によってデコーダにシグナリングされてよい。復号されたまたは補償されたフレームはさらにまた、DAC206に入力されてアナログ信号を出力する。フレーム/パケットロス補償は誤り補償ユニット(ECU:error concealment unit)と称される場合もある。
デコーダにおけるパケットロス補償を行う多数のやり方がある。いくつかの例として、消失フレームを無音と置き換えること、および最後のフレームを繰り返すこと(または最後のフレームのパラメータの復号)がある。他のアプローチでは、フレームを、継続する可能性が最も高いオーディオ信号と置き換えようと試みる。信号のような雑音に対して、1つのアプローチでは、同様のスペクトル構造を有する雑音を生成することができる。トーナル信号に対して、最初、現在のトーンの特性(周波数、振幅、および位相)が推定され、かつこれらのパラメータを使用して、消失フレームの対応する一時的な位置で継続するトーンが生成可能である。
ECUの別のアプローチは、最初は国際特許出願の国際公開第2014123470号パンフレットに記載され、その後3GPP TS 26.447 V15.0.0、5.4.3.5節に記載されたPhase ECUであり、この場合、デコーダは通常の復号中に復号された信号の原型を継続して保存し得る。この原型は消失フレームの場合に使用可能である。原型はスペクトル解析され、雑音および調的ECU機能はスペクトル領域で組み合わせられる。Phase ECUはそのスペクトルでトーンを識別し、かつ関連したスペクトルビンのスペクトル時間的置換を算出する。他のビン(非調的)は、雑音として処理され得、かつこれらのスペクトル領域における音のアーティファクトを回避するためにスクランブルがかけられる。結果として再現されたスペクトルは時間領域に変換された逆FFT(高速フーリエ変換)(IFFT)であり、信号は消失フレームの置換を生じさせるように処理される。オーディオコーデックが修正離散コサイン変換(MDCT)に基づく時、置換を生じさせることは、既に復号された信号の一体的な継続を生じさせるために重複MDCTに関連した、窓処理、TDA(時間領域エイリアシング)、およびITDA(逆TDA)を含む。この方法によって、MDCTメモリの継続した使用、および最初の良好フレームの使用されるMDCTメモリの作成が保証され得る。
周波数領域における正弦波モデリングを使用するPLCでは、再現された信号は、IFFT信号の終点では信頼性が低い場合がある。この一部は、特に、先頭のゼロおよび末尾のゼロに関して対称である時、MDCT分析窓の窓形状によってマスクされ得る。先頭のゼロは、将来のサンプル上に位置付けられることで、符号器のアルゴリズム的遅延を低くするため頻繁に使用され得る。末尾のゼロは、窓を簡易にするために主に使用される場合があるが、これによって、末尾のゼロが入力された信号に関するいずれの情報も加えることのない複雑さの一因になるため、変換効率が低くなる場合がある。したがって、より少ない末尾のゼロを使用することが一般的であり得る。低遅延の非対称MDCT窓は、同様の周波数分解能を有するより大きい遅延の対称MDCT窓より鮮鋭な(急速に増大する/急速に縮小する)窓形状を有し得る。IFFT信号のより低い信頼性と組み合わせたより鮮鋭な窓形状は、更新されたMDCTメモリ(別称、MDCT OLA(重畳加算)メモリバッファ)を含む最後の再構築された信号を生じさせるために使用される、MDCT分析窓処理、ならびに後続のTDAおよびITDAステップに対してこれらの信頼性が低い部分をより多く含む場合がある。これによって、再構築された信号の品質が低くなる場合がある。原型の長さを増大させる1つのアプローチがあり得るが、これは、PLCの複雑さを大幅に増大させ得るため、望ましくない場合がある。実際のオーディオコーデック内のより短いMDCT窓を使用する別のアプローチがあり得るが、これによって、オーディオコーデックに対する周波数分解能が悪くなる(および性能が悪くなる)場合がある。
(例えば、時間領域における信頼性の高い展開するサンプルのおおよそ12msを提供する、16msに対応する長さの)比較的短い逆高速フーリエ変換(IFFT)、および時間領域サンプルの提供された12msよりかなり大きい(例えば、18ms)「窓処理->TDA->ITDA」入力を使用する低遅延MDCT分析および合成ステップの組み合わせは、解決が困難な問題である。より大きいIFFTを使用すると(例えば、PLCの)複雑さが増大し、より小さい低遅延MDCT(LD-MDCT)窓を使用するとコーデックのスペクトル分解能が減少し、これによってさらには圧縮効率が低下することになる。
発明概念のいくつかの実施形態によると、受信されたオーディオ信号と関連付けられた消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填するためにデコーダを動作させるための方法が提供される。このような方法では、受信されたオーディオ信号の前に受信された部分の第1のセグメントは、原型バッファからコピーされる。原型バッファからの受信されたオーディオ信号の前に受信された部分の第2のセグメントは、受信されたオーディオ信号の再構築された部分の最初の一部に重畳加算され、受信されたオーディオ信号の再構築された部分の残りの一部が後続する
発明概念のさらなる実施形態によると、受信されたオーディオ信号と関連付けられた消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填するためのデコーダが提供される。デコーダは、プロセッサ、およびプロセッサと接続されたメモリを含み、メモリは、プロセッサによって実行される時、デコーダに動作を行わせる命令を含む。デコーダは、原型バッファから、受信されたオーディオ信号の前に受信された部分の第1のセグメントをコピーすることを含む動作を行う。デコーダは、原型バッファからの受信されたオーディオ信号の前に受信された部分の第2のセグメントを、受信されたオーディオ信号の再構築された部分の最初の一部に重畳加算し、受信されたオーディオ信号の再構築された部分の残りの一部が後続する、重畳加算することを含むさらなる動作を行う。
発明概念のさらに他の実施形態によると、受信されたオーディオ信号と関連付けられた消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填するためのデコーダが提供され、この場合、デコーダは、原型バッファから、受信されたオーディオ信号の前に受信された部分の第1のセグメントをコピーすること、および、原型バッファからの受信されたオーディオ信号の前に受信された部分の第2のセグメントを、受信されたオーディオ信号の再構築された部分の最初の一部に重畳加算し、受信されたオーディオ信号の再構築された部分の残りの一部が後続する、重畳加算することを含む動作を行うように適応される。
さらなる実施形態によると、受信されたオーディオ信号と関連付けられた消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填するためのデコーダの少なくとも1つのプロセッサによって実行されるプログラムコードを含む、コンピュータプログラムが提供される。プログラムコードの実行によって、デコーダは、原型バッファから、受信されたオーディオ信号の前に受信された部分の第1のセグメントをコピーすること、および、原型バッファからの受信されたオーディオ信号の前に受信された部分の第2のセグメントを、受信されたオーディオ信号の再構築された部分の最初の一部に重畳加算し、受信されたオーディオ信号の再構築された部分の残りの一部が後続する、重畳加算することを含む動作を行う。
さらに他の実施形態によると、受信されたオーディオ信号と関連付けられた消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填するためのデコーダ(1300)の少なくとも1つのプロセッサ(1306)によって実行されるプログラムコードを含む非一時的な記憶媒体を含む、コンピュータプログラム製品が提供される。プログラムコードの実行によって、デコーダは、原型バッファから、受信されたオーディオ信号の前に受信された部分の第1のセグメントをコピーすること、および、原型バッファからの受信されたオーディオ信号の前に受信された部分の第2のセグメントを、受信されたオーディオ信号の再構築された部分の最初の一部に重畳加算し、受信されたオーディオ信号の再構築された部分の残りの一部が後続する、重畳加算することを含む動作を行う。
いくつかの実施形態によると、MDCT窓のアクティブ部分を、PLC原型バッファ、およびIFFTおよびPLC原型バッファの終点間のOLAで既に利用可能である信号で充填することによって、IFFT信号の場合によっては信頼性が低い終点の影響を低減することができる。
本開示をさらに理解してもらうために含まれ、本出願の一部に組み込まれかつこれを構成する添付の図面は、発明概念のある特定の非限定的な実施形態を示す。
ネットワーク上でのオーディオエンコーダおよびオーディオデコーダの使用を示すブロック図である。 パケットロス補償を含むデコーダのブロック図である。 Phase ECU、およびPLC原型からの信号の再現の時間整合および信号線図を示す図である。 PLC信号再構築のための動作のフローチャートである。 発明概念のいくつかの実施形態による時間PLC信号を生成するためのフローチャートである。 発明概念のいくつかの実施形態によるPLC原型を使用するPLC処理の信号線図である。 発明概念のいくつかの実施形態によるOLA集計のための2つの窓を示す図である。 発明概念のいくつかの実施形態によるPhase ECUバッファ完了コピー長の表を示す図である。 発明概念のいくつかの実施形態によるPhase ECUバッファ完了OLA長の表を示す図である。 発明概念のいくつかの実施形態によるデコーダ動作を示すフローチャートである。 発明概念のいくつかの実施形態によるデコーダ動作を示すフローチャートである。 発明概念のいくつかの実施形態によるデコーダ動作を示すフローチャートである。 発明概念のいくつかの実施形態によるデコーダのブロック図である。 発明概念のいくつかの実施形態によるデコーダのブロック図である。 発明概念のいくつかの実施形態によるデコーダのブロック図である。
発明概念について、ここで、発明概念の実施形態の例が示される添付の図面を参照しながら以下にさらに詳しく説明する。しかしながら、発明概念は、多くの異なる形態で具現化されてよく、本明細書に示される実施形態に限定されるものと解釈されるべきではない。もっと正確に言えば、これらの実施形態は、本開示が徹底的かつ完全であり、本発明概念の範囲を当業者に十分に伝達するように提供される。これらの実施形態は相互排他的でないことにも留意されるべきである。1つの実施形態からの構成要素は、別の実施形態において存在する/使用されると暗に想定され得る。
以下の説明は、開示される主題のさまざまな実施形態を提示する。これらの実施形態は、教示例として提示され、開示される主題の範囲を限定するものと解釈されるものではない。例えば、説明される実施形態のいくつかの詳細は、説明される主題の範囲から逸脱することなく、修正、省略、または拡大され得る。
周波数領域において正弦波モデリングを使用するPLCでは、再現された信号はIFFT信号の終点では信頼性が低い場合がある。この一部は、特に、先頭のゼロおよび末尾のゼロに関して対称である時、MDCT分析窓の窓形状によってマスクされ得る。先頭のゼロは、将来のサンプル上に位置付けられることで、符号器のアルゴリズム的遅延を低くするため頻繁に使用され得る。末尾のゼロは、窓を簡易にするために主に使用される場合があるが、これによって、末尾のゼロが入力された信号に関するいずれの情報も加えることのない複雑さの一因になるため、変換効率が低くなる場合がある。したがって、より少ない末尾のゼロを使用することが一般的であり得る。
低遅延の非対称MDCT窓は、同様の周波数分解能を有するより大きい遅延の対称MDCT窓より鮮鋭な(急速に増大する/急速に縮小する)窓形状を有し得る。IFFT信号のより低い信頼性と組み合わせたより鮮鋭な窓形状は、更新されたMDCTメモリ(別称、MDCT OLAメモリバッファ)を含む最後の再構築された信号を生じさせるために使用される、MDCT分析窓処理、ならびに後続のTDAおよびITDAステップに対してこれらの信頼性が低い部分をより多く含む場合がある。これによって、再構築された信号の品質が低くなる場合がある。原型の長さを増大させる1つのアプローチがあり得るが、これは、PLCの複雑さを大幅に増大させ得るため、望ましくない場合がある。実際のオーディオコーデック内のより短いMDCT窓を使用する別のアプローチがあり得るが、これによって、オーディオコーデックに対する周波数分解能が悪くなる(および性能が悪くなる)場合がある。
(例えば、時間領域における信頼性の高い展開するサンプルのおおよそ12msを提供する、16msに対応する長さの)比較的短い逆高速フーリエ変換(IFFT)、および時間領域サンプルの提供された12msよりかなり大きい(例えば、18ms)「窓処理->TDA->ITDA」入力を使用する低遅延MDCT分析および合成ステップの組み合わせは、解決が困難な問題である。より大きいIFFTを使用すると(例えば、PLCの)複雑さが増大し、より小さいLD-MDCT窓を使用するとコーデックのスペクトル分解能が減少し、これによってさらには圧縮効率が低下することになり、このことは図3に示されている。図3は、原型の相展開および新たな一時的な位置(相)を使用して、Phase ECU、およびPLC原型からの信号の再現の時間整合および信号線図を示す。最後の再構築は、MDCT分析窓処理、TDAおよびITDAステップ、ならびに最後の合成窓処理ステップがまた過去に記憶したMDCT変換メモリ(MDCT-OLAバッファ)を使用し、かつ次のフレーム(GOODまたはBAD)中に使用するための新たな(MDCT-OLA信号バッファ)を生じさせるMDCT合成窓処理を使用して行われる。先読みのゼロを有する非対称のMDCT窓(LA_ZEROS-フレーム長の3/8)は、図3で使用されている。先読みのゼロを使用する同様の動作は、3GPP TS 26.447 V15.0.0、5.4.3.5節、3GPP TS 26.445 V15.1.0、5.3.2.2節、および3GPP TS 26.445 V15.1.0、6.2.4.1節に論述される。
発明概念の本開示のいくつかの実施形態は、MDCT窓のアクティブ部分をPLC原型バッファで既に利用可能である信号で充填することができ、かつIFFTおよびPLC原型バッファの終点間のOLAを使用してIFFT信号の場合によっては信頼性が低い終点部分の影響を低減することができる。
発明概念の本開示のいくつかの実施形態は、原型時間領域信号を使用してよい。正弦波モデリングを使用するPLCでは、デコーダは、PLC原型バッファにおける最後の復号された信号の形態で原型時間領域信号を保つ。すなわち、消失フレームの置換フレームは、先に合成した良好フレーム信号のフレームに対して正弦波モデルを適用することによって算出され、この場合、このフレームは原型フレームとしてサーブする。良好フレームは正しく受信されたフレームを意味するが、不良フレームは消去された、すなわち、消失したまたは壊れたフレームを意味する。
図4に移ると、欠落したまたは壊れたパケットは、接続をハンドリングするトランスポート層によって識別可能であり、かつ、不良フレームインジケータ(BFI)を通して「不良フレーム」としてデコーダにシグナリングされる。不良フレームインジケータ(BFI)が消失したまたは壊れたフレームが生じたことを指示する時、ブロック401における正弦波モデリングを使用するPLCは、最後の合成済みの良好フレーム信号(すなわち、原型フレーム)を使用して原型フレーム信号のスペクトル分析を行い、かつマグニチュード信号のピークを識別する。さらにまた、ピークの分数周波数はピーク周波数ビンを使用して推定される。ブロック403では、ピーク辺りの周波数ビンと共にピークに対応するピーク周波数ビンは、移相される。フレームの残りの周波数ビンについて、過去の合成の大きさはそのままであるが、相はランダム化されてよい。ブロック405では、時間領域信号はIFFTを使用して生じさせる。さらにまた、ブロック407に示されるように、MDCT窓処理、TDA、およびITDAが後続する。
発明概念の本開示のいくつかの実施形態は、MDCT分析窓全長を充填するように高品質の近似信号を生じさせるためにPLC原型バッファを使用してよい。これは2つの動作を伴ってよく、1つの動作では、MDCT処理バッファへのPLC原型バッファの1つのセグメントのコピーを実行してよい。その他の動作では、図4に示されるように、原型バッファの残りの最後の部分を初期時間に展開するIFFT信号によりMDCT処理バッファに重畳加算することができる。次いで、図4のブロック407に示されるように、MDCT窓処理、TDA、およびITDAが後続する。
3GPP TS 26.447 V15.1.0、6.2.4.1節で論じられる動作では、前のフレームからの時間領域原型信号は、第1のフレーム消失時にのみ使用される。連続した正弦波モデリングについて、原型のスペクトル表現は連続した消失フレームにおいて保存されかつ使用される。しかしながら、本開示のいくつかの実施形態のコピーおよびOLA動作を行うことができるように、連続したフレームエラー時に、原型バッファ(または別個の時間連続バッファ)の関連部分は、継続して(すなわち、BADフレーム時に)更新される必要がある場合がある。保存されたスペクトル表現では、連続した消失フレームの処理中に完全な原型バッファを更新することは必要ではない。
いくつかの実施形態では、品質は、パケット補償のための方法が周波数領域における正弦波モデリングである場合に改善され得る。それを保証することによって、Phase ECUのIFFTの後のフレーム再構築ステップが限定されたフレーム(すなわち、限定された正確な時間に展開させたサンプル)のみを提供する時でも、および、MDCT窓が先頭のゼロおよび末尾のゼロに関して非対称である時でも、再現されたフレームは現時点で復号されている信号と十分に統合される。
本明細書に開示される発明概念のさまざまな実施形態では、IFFT信号の信頼性が低い終点は部分的に置き換えられてよく、非対称のMDCT窓は窓処理、TDA、およびITDAステップに使用されてよい。これによって、その他の場合は取り入れられることになるフレームの繰り返される中断が低減可能である。本明細書に開示される発明概念は、トーナル信号のPLCの品質を改善し、かつその他の場合は、MDCT分析窓処理ステップに十分信頼性の高いサンプルを提供しないことによって生じる場合がある合成ノイズフロアを本質的に排除することができる。
本明細書に開示される発明概念のさまざまな実施形態では、比較的短いIFFT(例えば、結果として、信頼性の高い時間と共に展開するサンプルのおおよそ12msをもたらす16ms)は、MDCT分析/合成窓が高品質の分析および合成再構築をもたらすために信頼性の高い信号の12ms以上を必要としても効率的な低遅延MDCTと組み合わせて使用可能であり、かつコアオーディオデコーデックに(MDCT OLAメモリバッファを介して)インターフェース接続してよい。
発明概念のいくつかの実施形態では、MDCTは、10ms先の20ms窓で行われてよい。良好フレームの後に保存されたPLC原型フレームは長さが16msであり得る。関連した過渡検出器は、4msの長さの、すなわち、PLC原型フレームの4分の1の2つの短いFFTを使用してよい。これらの項目の実際の長さは、使用されるサンプリング周波数に左右され、8kHz~48kHzであり得る。これらの長さはそれぞれの変換時のスペクトルビンの数に影響する。
本明細書に開示されるいくつかの実施形態では、展開させ一時的に補正された信号xph(n)を生じさせることはコアPhase ECU方法に従って行われてよく、例えば、3GPP TS 26.477 V15.0.0、5.4.3.5節に論述されるコアPhase ECU方法を参照されたい。
本明細書に開示されるいくつかの実施形態では、信号xph(n)はさらにまた、両方向にxph_ext(n)に拡張されることで通常のMDCT窓と同じ長さを実現して、窓処理の前に最後の復号済みフレームから新たな再構築される信号への円滑な遷移を生じさせることができる。左(最も古い)部分は、2つのステップ、1つはセグメントコピー、もう1つはセグメント重畳加算を必要する場合がある。第1のステップでは、展開させかつ再構築された信号の前の合成された部分に対応する原型バッファからの1つの部分(時間領域サンプル)がコピー可能である。第2のステップでは、重畳加算セグメントは、原型バッファからの最後の部分とxph(k)における再構築された信号の最初の部分との間で行われてよい。再構築された信号の後の部分はゼロ拡張されてよい。この信号xph_ext(n)はさらにまた、窓処理(MDCT分析窓)され、かつMDCTベースのエンコーダで行われるように時間領域エイリアシングされてよい。非対称のMDCT窓における先頭のゼロのサンプルは、LA_ZEROSと称される。結果として生じる窓処理されかつ時間領域エイリアシングされた信号はさらにまた、従来のMDCTデコーダで説明されるように先のフレームからのMDCTのメモリ/状態で重畳加算(OLA)処理されてよい。
発明概念のいくつかの実施形態は、PLC原型のOLAに使用される窓、およびHann窓である後続の再構築されたPLC信号の非限定的な例において提示されるのに対し、本開示の実施形態はまた、窓処理の他のタイプ、例えば、ハミング窓、カイザー窓などに適用されてよい。
いくつかの実施形態は、OLAは最初、サンプル窓によるサンプルを適用して、PLC原型バッファからの一部分の範囲外のフェージングを実現することができる。窓は関数に従ってバッファにおけるそれぞれのサンプルをスケーリングする。
Figure 0007307805000001
ここでLolaはOLAセグメントの長さである。第2の窓は、それぞれのサンプルのスケーリングが以下のように規定されるように、再現されたIFFT時間領域信号の最初(最も古い)部分におけるフェージングを実現するために使用されてよい。
Figure 0007307805000002
PLC原型およびIFFT末尾による窓処理されたスケーリング済みサンプルは、集計され、かつOLA時間セグメントを新たに評価してよい。2つの窓(WoldおよびWnew)は、好ましくは、任意の点nにおける集計が1.0になるように構成される。
図8は、発明概念のいくつかの実施形態によるPhase ECUバッファ完了コピー長の表を示す。図8は、コピー部分(Lcopy)の長さがサンプリング周波数に依存することを示す。図9は、発明概念のいくつかの実施形態による、サンプリング周波数fに依存するハミング部分の長さを示す。
本開示のいくつかの実施形態は、定常状態正弦波に対する円滑でほとんど雑音がない合成信号を提供することができる。
本開示のいくつかの実施形態では、COPYセグメントおよびOLAセグメントの長さは、過去の合成信号および幾分信頼性が低い相展開させたIFFT信号の分析に基づいて動的に適応させてよい。
例えば、デフォルトの長さ(2.0ms、1.75ms)が結果として、信頼性が低いIFFT信号からの最も古いサンプルに対応する0.75ms領域において過渡が激しくなる場合に、COPY部分は2.75msに拡張され得、OLA部分は1msに低減され得る。過渡検出器は、最初の2msのRMS(二乗平均平方根)値を長さの両方のセット(COPY、OLA)による0.75msの適応領域のRMSと比較してよく、かつ、RMSエネルギーの最低の差異をもたらす長さのセットを使用してよい。
本開示のいくつかの実施形態では、複雑さは、GOOD非PLCフレームにおけるMDCT分析窓によってCOPYセグメントを前処理することによって低減可能である。同じことが、OLA_old窓およびMDCT窓の組み合わせを使用してCOPYセグメントおよびOLAセグメントに対して行われてよい。窓処理複雑さのこの再分配によって、BADフレームで使用される複雑さが大きくなり得る場合がある。
図5は、発明概念のいくつかの実施形態による時間PLC信号を生成するためのフローチャートである。ブロック401、403、および405は、図4の説明において上述されている。ブロック501では、完全な時間PLC信号は、原型信号からコピーおよびOLAを使用して完全なMDCT長で生成されてよい。ブロック503では、PLC信号を再現するために、MDCT分析窓、TDA、ITDA、およびMDCT合成、ならびにMDCT-OLAを永続化することを含む動作が行われてよい。図5の時間信号の生成は、信頼性が低い場合があるIFFT終点の使用を低減させることができる。
図6は、発明概念のいくつかの実施形態によるPLC処理の信号線図である。窓601は、MDCTフレームを充填し、かつPLC原型605と、IFFT再構築信号609の場合によっては信頼性が低い最初の終点との間の重畳加算(OLA)607を行うためのPLC原型605の使用を示す。609の他の終点は分析MDCT窓601の先読みのゼロと重なり合う。
図7は、2つの窓701(古い)および702(新しい)が2つの窓処理信号部分703を集計するのに貢献するOLAにどのように使用可能であるかを示す。
デコーダ1300の動作(図13~図15を参照)について、ここで、発明概念のいくつかの実施形態による図10~図12のフローチャートを参照しながら論じる。例えば、モジュールは図13~図15のメモリ1308に記憶されてよく、これらのモジュールは、モジュールの命令がプロセッサ1306によって実行される時、プロセッサ1306が対応するフローチャートの各動作を行うように命令を提供してよい。
図10は、受信されたオーディオ信号と関連付けられた消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填するためのデコーダの動作を示す。図10のブロック1000では、デコーダ1300のプロセッサ1306は、原型バッファ1318から、受信されたオーディオ信号の前に受信された部分の第1のセグメントを処理バッファ1320にコピーする。ブロック1002では、デコーダ1300のプロセッサ1306は、原型バッファ1318からの受信されたオーディオ信号の前に受信された部分の第2のセグメントを、処理バッファ1320への受信されたオーディオ信号の再構築された部分の最初の一部に重畳加算し、受信されたオーディオ信号の再構築された部分の残りの一部が後続する
図11は、連続した消失フレームがあり得る時、受信されたオーディオ信号と関連付けられた消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填するためのデコーダのさらなる動作を示す。
図11のブロック1100では、デコーダ1300のプロセッサ1306は、時間連続バッファ1316から、受信されたオーディオ信号の前に受信された部分の第1のセグメントをコピーする。ブロック1102では、デコーダ1300のプロセッサ1306は、時間連続バッファ1316からの受信されたオーディオ信号の前に受信された部分の第2のセグメントを、処理バッファ1320への受信されたオーディオ信号の再構築された部分の最初の一部に重畳加算し、受信されたオーディオ信号の再構築された部分の残りの一部が後続する
原型バッファ1318は新たに復号された信号で更新されてよく、時間連続バッファ1316はMDCT OLAの後に新たに再現された信号で更新されてよい。
図12は、分析窓長を、動的に適応させた信号セグメント長で充填するためのデコーダのさらなる動作を示す。図12のブロック1200では、デコーダ1300のプロセッサ1306は、充填された分析窓長からの前に合成された時間領域信号の分析に基づいて第1のセグメントおよび第2のセグメントの長さを動的に適応させてよい。
フローチャート11および12からのさまざまな動作は、デコーダおよび関連した方法のいくつかの実施形態に関してオプションであってよい。例えば、ブロック1100、1102、および1200はオプションであってよい。
上述されるさまざまな実施形態は、図13~図15に示されるようにデコーダにおけるコントローラに適用される。図13は、いくつかの実施形態によるデコーダの概略的なブロック図である。デコーダ1300は、符号化されたオーディオ信号を受信するように設定される入力ユニット1302を含む。図13は、論理フレーム消失補償ユニット1304によるフレーム消失補償を示し、これは、デコーダが本明細書に記載されるさまざまな実施形態に従って、消失したオーディオフレームの補償を実施するように設定されることを指示する。さらに、デコーダ1300は本明細書に記載されるさまざまな実施形態を実施するためのコントローラ1306(本明細書では、プロセッサまたはプロセッサユニットとも称される)を備える。コントローラ1306は入力(IN)に結合され、メモリ1308(本明細書では、メモリ回路とも称される)はプロセッサ1306に結合される。プロセッサ1306から得られる、復号されかつ再構築されたオーディオ信号は、出力(OUT)から出力される。メモリ1308は、プロセッサ1306によって実行される時、プロセッサに、本明細書に開示される実施形態による動作を行わせるコンピュータ可読プログラムコード1310を含んでよい。他の実施形態によると、プロセッサ1306は、別個のメモリが必要とされないようにメモリを含むように規定されてよい。
コントローラ1306は、受信されたオーディオ信号と関連付けられた消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填するように設定される。コントローラ1306は、原型バッファから、受信されたオーディオ信号の前に受信された部分の第1のセグメントを処理バッファにコピーしてよい。コントローラ1306は、原型バッファからの受信されたオーディオ信号の前に受信された部分の第2のセグメントを、処理バッファへの受信されたオーディオ信号の再構築された部分の最初の一部に重畳加算し、受信されたオーディオ信号の再構築された部分の残りの一部が後続する、重畳加算(OLA)してよい。図15に示されるように、コピーすることはコピーユニット1312によって行われてよく、OLAはOLAユニット1314によって行われてよい。コピーユニット1312およびOLAユニット1314を含むプロセッサ1306によって処理される信号は、図15に示されるような、時間連続バッファ1316、原型バッファ1318、および処理バッファ1320からを含むメモリ1308から提供されてよい。
デコーダと共にこのコピーユニットおよびOLAユニットは、ハードウェアに実装されてよい。デコーダのユニットの機能を実現するために使用かつ組み合わせ可能である回路要素の多数の別形がある。このような別形はさまざまな実施形態に包含される。デコーダのハードウェア実装の特定の例は、汎用電子回路および特定用途向け回路両方を含む、デジタル信号プロセッサ(DSP)ハードウェアおよび集積回路技術における実装である。
略語
以下の略語のうちの少なくともいくつかは、本開示で使用され得る。略語間に矛盾がある場合、上記の使用方法が優先されるものとする。以下に複数回列挙される場合、最初のリストがいずれの後続のリストよりも優先されるものとする。
略語および説明
ADC アナログ-デジタル変換器
BFI 不良フレームインジケータ
DAC デジタル-アナログ変換器
FFT 高速フーリエ変換
IFFT 逆高速フーリエ変換
ITDA 逆時間領域エイリアシング
LA_ZEROS 先読みのゼロ
MDCT 修正離散コサイン変換
OLA 重畳加算
TDA 時間領域エイリアシング
参考文献
[1]3GPP TS 26.447 V15.0.0 clause 5.4.3.5
[2]3GPP TS 26.445 V15.1.0 clause 5.3.2.2
[2]3GPP TS 26.445 V15.1.0 clause 6.2.4.1
参考文献の3GPP TS 26.447 V15.0.0、5.4.3.5節、3GPP TS 26.445 V15.1.0、5.3.2.2節、および3GPP TS 26.445 V15.1.0、6.2.4.1節は、これらの内容が本明細書に全て示されているかのように参照により本明細書に組み込まれる。
例示の実施形態について以下に論じる。参照番号/文字は、参照番号/文字によって指示される特定の要素に例示の実施形態を限定することなく、例/例示として括弧内に提供される。
1.受信されたオーディオ信号の消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填する方法であって、
原型バッファ(1318)から、受信されたオーディオ信号の前に受信された部分の第1のセグメントを処理バッファ(1320)にコピーすること(1000、1312)と、
原型バッファ(1318)からの受信されたオーディオ信号の前に受信された部分の第2のセグメントを、処理バッファ(1320)への受信されたオーディオ信号の再構築された部分の最初の一部に重畳加算し、受信されたオーディオ信号の再構築された部分の残りの一部が後続する、重畳加算すること(1002、1314)と、を含む、方法。
2.受信されたオーディオ信号の前に受信された部分は時間領域信号である、実施形態1の方法。
3.受信されたオーディオ信号の再構築された部分は時間と共に展開する変換信号を含む、実施形態1または2の方法。
4.処理バッファは重複変換修正離散コサイン変換(MDCT)バッファである、実施形態1から3のいずれかの方法。
5.MDCT分析窓は非対称である、実施形態1から4のいずれかの方法。
6.時間連続バッファ(1316)から、受信されたオーディオ信号の前に受信された部分の第1のセグメントをコピーすること(1100、1312)と、
時間連続バッファ(1316)からの受信されたオーディオ信号の前に受信された部分の第2のセグメントを、処理バッファ(1320)への受信されたオーディオ信号の再構築された部分の最初の一部に重畳加算し、受信されたオーディオ信号の再構築された部分の残りの一部が後続する、重畳加算すること(1102、1314)と、を含む、連続した消失フレームに対してコピーすることおよび重畳加算することをさらに含む、実施形態1から5のいずれかの方法。
7.時間連続バッファはMDCT重畳加算の後に新たに再現された信号で更新される、実施形態1から6のいずれかの方法。
8.分析窓の重畳加算部は、
原型バッファからの受信されたオーディオ信号の前に受信された部分の第1のスケーリングされたサンプルを得るために第1の窓を適用すること(701、1314)と、
受信されたオーディオ信号の再構築された部分の第2のスケーリングされたサンプルを得るために第2の窓を適用すること(702、1314)と、
分析窓の重畳加算部を形成するために第1のスケーリングされたサンプルおよび第2のスケーリングされたサンプルを集計すること(703、1314)と、を含む、実施形態1から7のいずれかの方法。
9.第1のセグメントの長さはサンプリング周波数に依存する、実施形態1から8のいずれかの方法。
10.分析窓の重畳加算部の長さはサンプリング周波数に依存する、実施形態1から9のいずれかの方法。
11.充填された分析窓長からの前に合成された時間領域信号の分析に基づいて第1のセグメントおよび第2のセグメントの長さを動的に適応させること(1200、1306)をさらに含む、実施形態1から10のいずれかの方法。
12.受信されたオーディオ信号の消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填するためのデコーダ(1300)であって、
プロセッサ(1306)と、
プロセッサと接続されたメモリ(1308)であって、該メモリは、プロセッサによって実行される時、デコーダに実施形態1から11のいずれかによる動作を行わせる命令を含む、メモリ(1308)と、を備える、デコーダ(1300)。
13.受信されたオーディオ信号の消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填するためのデコーダ(1300)であって、デコーダは実施形態1から11のいずれかに従って実行するように適応される、デコーダ(1300)。
14.受信されたオーディオ信号の消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填するためのデコーダ(1300)の少なくとも1つのプロセッサ(1306)によって実行されるプログラムコードを含む、コンピュータプログラムであって、プログラムコードの実行によって、デコーダ(1300)は実施形態1から11のいずれか1つによる動作を行う、コンピュータプログラム。
15.受信されたオーディオ信号の消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填するためのデコーダ(1300)の少なくとも1つのプロセッサ(1306)によって実行されるプログラムコードを含む非一時的な記憶媒体を含むコンピュータプログラム製品であって、プログラムコードの実行によって、デコーダ(1300)は実施形態1から11のいずれか1つによる動作を行う、コンピュータプログラム製品。
さらなる説明
概して、本明細書で使用される全ての用語は、異なる意味が、明確に与えられ、および/またはその用語が使用される文脈から暗示されない限り、関連する技術分野におけるこれらの通常の意味に従って解釈されるものとする。1つの(a/an)/その(the)要素、装置、構成要素、手段、ステップなどへの全ての言及は、別段明示的に述べられていない限り、その要素、装置、構成要素、手段、ステップなどの少なくとも1つの事例に言及しているものとしてオープンに解釈されるものとする。本明細書に開示されるいずれの方法のステップも、ステップが、別のステップに後続するまたは先行するものとして明示的に説明されない限り、および/またはステップが別のステップに後続または先行しなければならないことが暗黙的である場合、開示される厳密な順序で実行される必要はない。本明細書で開示される実施形態のいずれかの任意の特徴は、適切であればいかなる場合も、任意の他の実施形態に適用されてよい。同様に、実施形態のいずれかの任意の利点は、任意の他の実施形態に適用されてよく、その逆もまた同様である。同封の実施形態の他の目的、特徴、および利点は、以下の説明から明らかになるであろう。
本明細書に開示される、任意の適切なステップ、方法、特徴、機能、または利益は、1つまたは複数の仮想装置の1つまたは複数の機能ユニットまたはモジュールを通して行われてよい。それぞれの仮想装置はいくつかのこれらの機能ユニットを含んでよい。これらの機能ユニットは、1つまたは複数のマイクロプロセッサもしくはマイクロコントローラ、およびデジタル信号プロセッサ(DSP)および専用デジタル論理などを含んでよい他のデジタルハードウェアを含むことができる処理回路によって実装されてよい。処理回路は、読み出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、キャッシュメモリ、フラッシュメモリデバイス、光記憶デバイスなどの1つまたはいくつかのタイプのメモリを含んでよいメモリに記憶されるプログラムコードを実行するように設定されてよい。メモリに記憶されるプログラムコードは、1つまたは複数の通信および/またはデータ通信プロトコルを実行するためのプログラム命令、および、本明細書に説明される技法の1つまたは複数を実行するための命令を含む。いくつかの実装形態では、処理回路を使用して、対応する機能ユニットに、本開示の1つまたは複数の実施形態による対応する機能を実行させることができる。
ユニットという用語は、電子機器、電気デバイス、および/または電子デバイスの分野における従来の意味を有することができ、例えば、電気および/または電子回路、デバイス、モジュール、プロセッサ、メモリ、ロジックソリッドステートおよび/またはディスクリートデバイス、本明細書に説明されるものなどの、各タスク、手順、計算、出力を実行する、および/または機能を表示するなどのためのコンピュータプログラムもしくは命令を含むことができる。
本発明概念のさまざまな実施形態の上記の説明では、本明細書で使用される専門用語は、特定の実施形態を説明するためのものに過ぎず、本発明概念を限定するものではないことを理解されたい。別段規定されない限り、本明細書で使用される(技術用語および科学用語を含む)全ての用語は、本発明概念が属する技術の当業者によって通常理解されるものと同じ意味を有する。通常使用される辞書において規定される用語などの用語が、本明細書および関連技術の文脈におけるそれらの用語の意味に従う意味を有するものとして解釈されるべきであり、明白にそのように本明細書で規定されない限り、理想的なまたは過度に形式的な意味において解釈されないことは、さらに理解されるであろう。
ある要素が、別の要素に「接続された」、「結合された」、「応答する」、またはこれらの別形であると称される時、その要素は、他の要素に直接、接続され、結合され、もしくは応答し得、または介在する要素が存在し得る。対照的に、ある要素が、別の要素に「直接接続された」、「直接結合された」、「直接応答する」、またはこれらの別形であると称される時、介在する要素は存在しない。同様の番号は、全体を通して同様の要素を指す。さらに、本明細書で使用される、「結合された」、「接続された」、「応答する」、またはこれらの別形は、無線で結合された、無線で接続された、または無線で応答する、を含み得る。本明細書で使用される際、単数形「a」、「an」、および「the」は、文脈で別段明確に指示しない限り、複数形も含むことが意図される。簡潔および/または明確にするために、周知の機能または構築は詳細に説明されない場合がある。「および/または」という用語は、関連の列挙された項目のうちの1つまたは複数の任意のおよび全ての組み合わせを含む。
さまざまな要素/動作を説明するために、第1の、第2の、第3のなどの用語が本明細書で使用され得るが、これらの要素/動作が、これらの用語によって限定されるべきでないことは理解されるであろう。これらの用語は、ある要素/動作を別の要素/動作と区別するために使用されるに過ぎない。よって、本発明概念の教示から逸脱することなく、いくつかの実施形態における第1の要素/動作は、他の実施形態において第2の要素/動作と呼ばれる可能性がある。同じ参照符号または同じ参照指示子は、本明細書全体を通して同じまたは同様の要素を示す。
本明細書で使用される際、「備える(comprise)」、「備える(comprising)」、「備える(comprises)」、「含む(include)」、「含む(including)」、「含む(includes)」、「有する(have)」、「有する(has)」、「有する(having)」という用語、またはこれらの別形は、オープンエンドであり、1つまたは複数の述べられた特徴、整数、要素、ステップ、構成要素、または機能を含むが、1つまたは複数の他の特徴、整数、要素、ステップ、構成要素、機能、またはこれらのグループの存在または追加を除外しない。さらに、本明細書で使用される際、ラテン語の「exempli gratia」から派生した一般的な略語「例えば(e.g.)」は、先に言及した項目の一般的な例(単数または複数)を紹介または指定するために使用されてよく、このような項目を限定するものではない。ラテン語の「id est」から派生した一般的な略語「すなわち(i.e.)」は、より一般的な詳説から特定の項目を指定するために使用され得る。
例示的な実施形態は、コンピュータ実施方法、装置(システムおよび/またはデバイス)、および/またはコンピュータプログラム製品のブロック図および/またはフローチャート説明図を参照しながら本明細書に説明される。ブロック図および/またはフローチャート説明図のブロック、ならびにブロック図および/またはフローチャート説明図におけるブロックの組み合わせが、1つまたは複数のコンピュータ回路によって実行されるコンピュータプログラム命令によって実施され得ることは理解されたい。これらのコンピュータプログラム命令は、コンピュータのプロセッサおよび/または他のプログラマブルデータ処理装置を介して実行する命令が、トランジスタ、メモリ位置に記憶された値、およびこのような回路内の他のハードウェア構成要素を変換および制御して、ブロック図および/またはフローチャートのブロック(単数または複数)において指定された機能/作用を実装することによって、ブロック図および/またはフローチャートのブロックにおいて指定された機能/作用を実装するための手段(機能性)および/または構造を生じさせるように、マシンを製作するために、汎用コンピュータ回路、専用コンピュータ回路、および/または他のプログラマブルデータ処理回路の、プロセッサ回路に提供されてよい。
これらのコンピュータプログラム命令はまた、コンピュータまたは他のプログラマブルデータ処理装置に特定の様式で機能するように指図することができる、有形コンピュータ可読媒体に記憶されてよいことで、コンピュータ可読媒体に記憶された命令は、ブロック図および/またはフローチャートのブロック(単数または複数)において指定された機能/作用を実装する命令を含む製品を作り出す。それ故に、本発明概念の実施形態は、ハードウェアで、および/または「回路」、「モジュール」、またはこれらの別形と総称される場合がある、デジタル信号プロセッサなどのプロセッサ上で実行する(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)ソフトウェアで具現化可能である。
いくつかの代替の実装形態では、ブロックにおいて述べられる機能/作用は、フローチャートにおいて述べられる順序以外で行われ得ることも留意されるべきである。例えば、関与する機能性/作用に応じて、連続して示される2つのブロックは、実際に、実質的に同時に実行され得る、またはブロックは時々逆の順序で実行され得る。さらに、フローチャートおよび/またはブロック図の所与のブロックの機能性は複数のブロックに分離されてよい、および/または、フローチャートおよび/またはブロック図の2つ以上のブロックの機能性は少なくとも部分的に統合されてよい。最後に、他のブロックは、示されるブロック間に追加/挿入されてよい、および/または、発明概念の範囲から逸脱することなく、ブロック/動作は省略されてよい。また、図のうちのいくつかが、通信の主要な方向を示すために通信経路上に矢印を含むが、通信が、図示された矢印と反対方向に行われ得ることは理解されたい。
本発明概念の原理から実質的に逸脱することなく、実施形態に対して多くの変形および修正がなされ得る。全てのこのような変形および修正は、本発明概念の範囲内で本明細書に含まれることが意図される。それ故に、上記で開示された主題は、例示であり、制限するものではないと見なされるべきであり、実施形態の例は、本発明概念の趣旨および範囲内に入る、全てのこのような修正、拡張、および他の実施形態を包含することが意図される。よって、法によって最大限に許容される限りにおいて、本発明概念の範囲は、実施形態およびこれらの等価物の例を含む、本開示の最も広い許容可能な解釈によって判断されるべきであり、前述の詳細な説明によって制限または限定されないものとする。

Claims (22)

  1. 受信されたオーディオ信号と関連付けられた消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填する方法であって、
    原型バッファ(1318)から、受信されたオーディオ信号の前に受信された部分の第1のセグメントをコピーすること(1000、1312)と、
    前記原型バッファ(1318)からの前記受信されたオーディオ信号の前記前に受信された部分の第2のセグメントを、前記受信されたオーディオ信号の再構築された部分の最初の一部に重畳加算し、前記受信されたオーディオ信号の前記再構築された部分の残りの一部が後続する、重畳加算すること(1002、1314)と、
    を含む、方法。
  2. 前記原型バッファ(1318)から、前記受信されたオーディオ信号の前記前に受信された部分の前記第1のセグメントをコピーすることは、前記受信されたオーディオセグメントの前記前に受信された部分の前記第1のセグメントを処理バッファ(1320)にコピーすることを含み、前記原型バッファからの前記受信されたオーディオ信号の前記前に受信された部分の前記第2のセグメントを前記受信されたオーディオ信号の前記再構築された部分の前記最初の一部に重畳加算することは、前記原型バッファからの前記受信されたオーディオ信号の前記前に受信された部分の前記第2のセグメントを、前記処理バッファ(1320)への前記受信されたオーディオ信号の再構築された部分の前記最初の一部に重畳加算することを含む、請求項1に記載の方法。
  3. 前記受信されたオーディオ信号の前記前に受信された部分は時間領域信号である、請求項1または2に記載の方法。
  4. 前記受信されたオーディオ信号の前記再構築された部分は時間と共に展開する変換信号を含む、請求項1から3のいずれか一項に記載の方法。
  5. 前記処理バッファは重複変換修正離散コサイン変換(MDCT:modified discrete cosine transform)バッファである、請求項に記載の方法。
  6. 前記分析窓は非対称である、請求項1から4のいずれか一項に記載の方法。
  7. 時間連続バッファ(1316)から、再現されたオーディオ信号の第1のセグメントをコピーすること(1100、1312)と、
    前記時間連続バッファ(1316)からの前記再現されたオーディオ信号の第2のセグメントを、前記処理バッファ(1320)への前記再現されたオーディオ信号の再構築された部分の最初の一部に重畳加算し、前記再現されたオーディオ信号の前記再構築された部分の残りの一部が後続する、重畳加算すること(1102、1314)と、
    を含む、連続した消失フレームに対してコピーすることおよび重畳加算することをさらに含む、請求項に記載の方法。
  8. 前記時間連続バッファは前記重畳加算の後に新たに再現された信号で更新される、請求項7に記載の方法。
  9. 前記分析窓の重畳加算部は、
    前記原型バッファからの前記受信されたオーディオ信号の前記前に受信された部分の第1のスケーリングされたサンプルを得るために第1の窓を適用すること(701、1314)と、
    前記受信されたオーディオ信号の前記再構築された部分の第2のスケーリングされたサンプルを得るために第2の窓を適用すること(702、1314)と、
    前記分析窓の前記重畳加算部を形成するために前記第1のスケーリングされたサンプルおよび前記第2のスケーリングされたサンプルを集計すること(703、1314)と、
    を含む、請求項1から8のいずれか一項に記載の方法。
  10. 充填された分析窓長からの前に合成された時間領域信号の分析に基づいて前記第1のセグメントおよび前記第2のセグメントの長さを動的に適応させること(1200、1306)をさらに含む、請求項1から9のいずれか一項に記載の方法。
  11. 受信されたオーディオ信号と関連付けられた消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填するためのデコーダ(1300)であって、
    プロセッサ(1306)と、
    前記プロセッサと接続されたメモリ(1308)であって、前記メモリは、前記プロセッサによって実行される時、前記デコーダに、
    原型バッファ(1318)から、受信されたオーディオ信号の前に受信された部分の第1のセグメントをコピーすること(1000、1312)、および
    前記原型バッファ(1318)からの前記受信されたオーディオ信号の前記前に受信された部分の第2のセグメントを、前記受信されたオーディオ信号の再構築された部分の最初の一部に重畳加算し、前記受信されたオーディオ信号の前記再構築された部分の残りの一部が後続する、重畳加算すること(1002、1314)を含む動作を行わせる命令を含む、メモリ(1308)と、
    を備える、デコーダ(1300)。
  12. 前記原型バッファ(1318)から、前記受信されたオーディオ信号の前記前に受信された部分の前記第1のセグメントをコピーする際に、前記デコーダは、前記受信されたオーディオセグメントの前記前に受信された部分の前記第1のセグメントを処理バッファ(1320)にコピーすることを含む動作を行い、前記原型バッファからの前記受信されたオーディオ信号の前記前に受信された部分の前記第2のセグメントを前記受信されたオーディオ信号の前記再構築された部分の前記最初の一部に重畳加算する際に、前記デコーダは、前記原型バッファからの前記受信されたオーディオ信号の前記前に受信された部分の前記第2のセグメントを、前記処理バッファ(1320)への前記受信されたオーディオ信号の再構築された部分の前記最初の一部に重畳加算することを含む動作を行う、請求項11に記載のデコーダ。
  13. 前記受信されたオーディオ信号の前記前に受信された部分は時間領域信号である、請求項11または12に記載のデコーダ。
  14. 前記受信されたオーディオ信号の前記再構築された部分は時間と共に展開する変換信号を含む、請求項11から13のいずれか一項に記載のデコーダ。
  15. 前記処理バッファは重複変換修正離散コサイン変換(MDCT:modified discrete cosine transform)バッファである、請求項12に記載のデコーダ。
  16. 前記デコーダは、
    時間連続バッファ(1316)から、再現されたオーディオ信号の第1のセグメントをコピーすること(1100、1312)と、
    前記時間連続バッファ(1316)からの前記再現されたオーディオ信号の第2のセグメントを、前記処理バッファ(1320)への前記再現されたオーディオ信号の再構築された部分の最初の一部に重畳加算し、前記再現されたオーディオ信号の前記再構築された部分の残りの一部が後続する、重畳加算すること(1102、1314)と、
    をさらに含む動作を行う、請求項12に記載のデコーダ。
  17. 前記デコーダは、前記重畳加算の後に前記時間連続バッファを新たに再現された信号で更新することを含むさらなる動作を行う、請求項16に記載のデコーダ。
  18. 分析窓の重畳加算部は、
    前記原型バッファからの前記受信されたオーディオ信号の前記前に受信された部分の第1のスケーリングされたサンプルを得るために第1の窓を適用すること(701、1314)と、
    前記受信されたオーディオ信号の前記再構築された部分の第2のスケーリングされたサンプルを得るために第2の窓を適用すること(702、1314)と、
    前記分析窓の前記重畳加算部を形成するために前記第1のスケーリングされたサンプルおよび前記第2のスケーリングされたサンプルを集計すること(703、1314)と、
    を含む、請求項11から17のいずれか一項に記載のデコーダ。
  19. 前記デコーダは、
    充填された分析窓長からの前に合成された時間領域信号の分析に基づいて前記第1のセグメントおよび前記第2のセグメントの長さを動的に適応させること(1200、1306)
    を含むさらなる動作を行う、請求項11から18のいずれか一項に記載のデコーダ。
  20. 前記分析窓は非対称である、請求項11から14のいずれか一項に記載のデコーダ。
  21. 受信されたオーディオ信号と関連付けられた消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填するためのデコーダ(1300)であって、前記デコーダは、請求項1から10のいずれか一項に記載の方法の動作を行うように適応される、デコーダ(1300)。
  22. 受信されたオーディオ信号と関連付けられた消失したオーディオフレームを補償するために分析窓長を時間領域信号で充填するためのデコーダ(1300)の少なくとも1つのプロセッサ(1306)によって実行されるプログラムコードを含む、コンピュータプログラムであって、
    前記プログラムコードの実行によって、前記デコーダ(1300)は、請求項1から10のいずれか一項に記載の方法の動作を行う、コンピュータプログラム。
JP2021547688A 2019-02-21 2020-02-20 周波数領域パケットロス補償のための方法、および関連デコーダ Active JP7307805B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023107640A JP2023138988A (ja) 2019-02-21 2023-06-30 周波数領域パケットロス補償のための方法、および関連デコーダ

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962808610P 2019-02-21 2019-02-21
US201962808587P 2019-02-21 2019-02-21
US201962808600P 2019-02-21 2019-02-21
US62/808,587 2019-02-21
US62/808,600 2019-02-21
US62/808,610 2019-02-21
PCT/EP2020/054522 WO2020169756A1 (en) 2019-02-21 2020-02-20 Methods for frequency domain packet loss concealment and related decoder

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023107640A Division JP2023138988A (ja) 2019-02-21 2023-06-30 周波数領域パケットロス補償のための方法、および関連デコーダ

Publications (3)

Publication Number Publication Date
JP2022521077A JP2022521077A (ja) 2022-04-05
JPWO2020169756A5 JPWO2020169756A5 (ja) 2023-03-10
JP7307805B2 true JP7307805B2 (ja) 2023-07-12

Family

ID=69701173

Family Applications (6)

Application Number Title Priority Date Filing Date
JP2021547686A Active JP7335968B2 (ja) 2019-02-21 2020-02-20 Mdct係数からのスペクトル形状予測
JP2021547687A Active JP7178506B2 (ja) 2019-02-21 2020-02-20 位相ecu f0補間スプリットのための方法および関係するコントローラ
JP2021547688A Active JP7307805B2 (ja) 2019-02-21 2020-02-20 周波数領域パケットロス補償のための方法、および関連デコーダ
JP2022181549A Active JP7471375B2 (ja) 2019-02-21 2022-11-14 位相ecu f0補間スプリットのための方法および関係するコントローラ
JP2023107640A Pending JP2023138988A (ja) 2019-02-21 2023-06-30 周波数領域パケットロス補償のための方法、および関連デコーダ
JP2023133704A Pending JP2023166423A (ja) 2019-02-21 2023-08-18 Mdct係数からのスペクトル形状予測

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2021547686A Active JP7335968B2 (ja) 2019-02-21 2020-02-20 Mdct係数からのスペクトル形状予測
JP2021547687A Active JP7178506B2 (ja) 2019-02-21 2020-02-20 位相ecu f0補間スプリットのための方法および関係するコントローラ

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP2022181549A Active JP7471375B2 (ja) 2019-02-21 2022-11-14 位相ecu f0補間スプリットのための方法および関係するコントローラ
JP2023107640A Pending JP2023138988A (ja) 2019-02-21 2023-06-30 周波数領域パケットロス補償のための方法、および関連デコーダ
JP2023133704A Pending JP2023166423A (ja) 2019-02-21 2023-08-18 Mdct係数からのスペクトル形状予測

Country Status (9)

Country Link
US (4) US11705136B2 (ja)
EP (3) EP3928314A1 (ja)
JP (6) JP7335968B2 (ja)
KR (1) KR20210130743A (ja)
CN (3) CN113439302A (ja)
BR (1) BR112021014477A2 (ja)
CO (2) CO2021010587A2 (ja)
MX (1) MX2021009635A (ja)
WO (3) WO2020169756A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111984920B (zh) * 2020-08-31 2022-03-18 广东电网有限责任公司广州供电局 次/超同步谐波参数识别方法、装置、设备和介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016510432A (ja) 2013-02-05 2016-04-07 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオフレーム損失のコンシールメントを制御する方法及び装置
JP2016511433A (ja) 2013-02-05 2016-04-14 テレフオンアクチーボラゲット エルエム エリクソン(パブル) オーディオフレーム損失コンシールメント
JP2016528535A (ja) 2013-07-05 2016-09-15 ドルビー インターナショナル アクチボラグ パケット損失補償装置およびパケット損失補償方法、ならびに音声処理システム
JP2017521728A (ja) 2014-07-28 2017-08-03 サムスン エレクトロニクス カンパニー リミテッド パケット損失隠匿方法及びその装置、並びにそれを適用した復号方法及びその装置

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5884253A (en) * 1992-04-09 1999-03-16 Lucent Technologies, Inc. Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter
KR970011728B1 (ko) * 1994-12-21 1997-07-14 김광호 음향신호의 에러은닉방법 및 그 장치
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
US7117156B1 (en) * 1999-04-19 2006-10-03 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US6775649B1 (en) * 1999-09-01 2004-08-10 Texas Instruments Incorporated Concealment of frame erasures for speech transmission and storage system and method
WO2001033411A1 (en) * 1999-10-30 2001-05-10 Stmicroelectronics Asia Pacific Pte. Ltd. Fast modified discrete cosine transform method
KR100591350B1 (ko) 2001-03-06 2006-06-19 가부시키가이샤 엔.티.티.도코모 오디오 데이터 보간장치 및 방법, 오디오 데이터관련 정보작성장치 및 방법, 오디오 데이터 보간 정보 송신장치 및방법, 및 그 프로그램 및 기록 매체
US7324444B1 (en) * 2002-03-05 2008-01-29 The Board Of Trustees Of The Leland Stanford Junior University Adaptive playout scheduling for multimedia communication
KR100467617B1 (ko) * 2002-10-30 2005-01-24 삼성전자주식회사 개선된 심리 음향 모델을 이용한 디지털 오디오 부호화방법과그 장치
KR100477701B1 (ko) * 2002-11-07 2005-03-18 삼성전자주식회사 Mpeg 오디오 인코딩 방법 및 mpeg 오디오 인코딩장치
US7325023B2 (en) 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7526351B2 (en) * 2005-06-01 2009-04-28 Microsoft Corporation Variable speed playback of digital audio
US8473298B2 (en) * 2005-11-01 2013-06-25 Apple Inc. Pre-resampling to achieve continuously variable analysis time/frequency resolution
US8798172B2 (en) * 2006-05-16 2014-08-05 Samsung Electronics Co., Ltd. Method and apparatus to conceal error in decoded audio signal
DK2102619T3 (en) * 2006-10-24 2017-05-15 Voiceage Corp METHOD AND DEVICE FOR CODING TRANSITION FRAMEWORK IN SPEECH SIGNALS
JP5103880B2 (ja) 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
KR101292771B1 (ko) * 2006-11-24 2013-08-16 삼성전자주식회사 오디오 신호의 오류은폐방법 및 장치
CN101207468B (zh) * 2006-12-19 2010-07-21 华为技术有限公司 丢帧隐藏方法、系统和装置
US8165872B2 (en) * 2007-02-01 2012-04-24 Broadcom Corporation Method and system for improving speech quality
US8468024B2 (en) * 2007-05-14 2013-06-18 Freescale Semiconductor, Inc. Generating a frame of audio data
JP5618826B2 (ja) * 2007-06-14 2014-11-05 ヴォイスエイジ・コーポレーション Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法
US8185388B2 (en) * 2007-07-30 2012-05-22 Huawei Technologies Co., Ltd. Apparatus for improving packet loss, frame erasure, or jitter concealment
TW200912892A (en) * 2007-09-04 2009-03-16 Univ Nat Central Method and apparatus of low-complexity psychoacoustic model applicable for advanced audio coding encoders
WO2009109050A1 (en) * 2008-03-05 2009-09-11 Voiceage Corporation System and method for enhancing a decoded tonal sound signal
US20100324911A1 (en) * 2008-04-07 2010-12-23 Broadcom Corporation Cvsd decoder state update after packet loss
CN101588341B (zh) * 2008-05-22 2012-07-04 华为技术有限公司 一种丢帧隐藏的方法及装置
US9076439B2 (en) * 2009-10-23 2015-07-07 Broadcom Corporation Bit error management and mitigation for sub-band coding
US20110196673A1 (en) * 2010-02-11 2011-08-11 Qualcomm Incorporated Concealing lost packets in a sub-band coding decoder
EP2770503B1 (en) 2011-10-21 2019-05-29 Samsung Electronics Co., Ltd. Method and apparatus for concealing frame errors and method and apparatus for audio decoding
CN103714821A (zh) * 2012-09-28 2014-04-09 杜比实验室特许公司 基于位置的混合域数据包丢失隐藏
US9325544B2 (en) * 2012-10-31 2016-04-26 Csr Technology Inc. Packet-loss concealment for a degraded frame using replacement data from a non-degraded frame
FR3001593A1 (fr) * 2013-01-31 2014-08-01 France Telecom Correction perfectionnee de perte de trame au decodage d'un signal.
US9478221B2 (en) 2013-02-05 2016-10-25 Telefonaktiebolaget Lm Ericsson (Publ) Enhanced audio frame loss concealment
FR3004876A1 (fr) * 2013-04-18 2014-10-24 France Telecom Correction de perte de trame par injection de bruit pondere.
BR112015032013B1 (pt) 2013-06-21 2021-02-23 Fraunhofer-Gesellschaft zur Förderung der Angewandten ForschungE.V. Método e equipamento para a obtenção de coeficientes do espectropara um quadro de substituição de um sinal de áudio, descodificador de áudio,receptor de áudio e sistema para transmissão de sinais de áudio
NO2780522T3 (ja) * 2014-05-15 2018-06-09
FR3024582A1 (fr) * 2014-07-29 2016-02-05 Orange Gestion de la perte de trame dans un contexte de transition fd/lpd
JP2016038435A (ja) 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN107004417B (zh) * 2014-12-09 2021-05-07 杜比国际公司 Mdct域错误掩盖
US9978400B2 (en) * 2015-06-11 2018-05-22 Zte Corporation Method and apparatus for frame loss concealment in transform domain
EP3182410A3 (en) * 2015-12-18 2017-11-01 Dolby International AB Enhanced block switching and bit allocation for improved transform audio coding
JP6883047B2 (ja) * 2016-03-07 2021-06-02 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 適切に復号されたオーディオフレームの復号化表現の特性を使用する誤り隠蔽ユニット、オーディオデコーダ、および関連する方法およびコンピュータプログラム
BR112018067944B1 (pt) * 2016-03-07 2024-03-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Unidade de ocultação de erro, método de ocultação de erro,decodificador de áudio, codificador de áudio, método para fornecer uma representação de áudio codificada e sistema
JP6826126B2 (ja) * 2016-03-07 2021-02-03 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 異なる周波数帯域の異なる減衰係数に従って隠蔽されたオーディオフレームをフェードアウトする誤り隠蔽ユニット、オーディオデコーダ、および関連する方法およびコンピュータプログラム
JP6976277B2 (ja) * 2016-06-22 2021-12-08 ドルビー・インターナショナル・アーベー 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法
EP3616196A4 (en) * 2017-04-28 2021-01-20 DTS, Inc. AUDIO ENCODER WINDOW AND TRANSFORMATION IMPLEMENTATIONS

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016510432A (ja) 2013-02-05 2016-04-07 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオフレーム損失のコンシールメントを制御する方法及び装置
JP2016511433A (ja) 2013-02-05 2016-04-14 テレフオンアクチーボラゲット エルエム エリクソン(パブル) オーディオフレーム損失コンシールメント
JP2016528535A (ja) 2013-07-05 2016-09-15 ドルビー インターナショナル アクチボラグ パケット損失補償装置およびパケット損失補償方法、ならびに音声処理システム
JP2017521728A (ja) 2014-07-28 2017-08-03 サムスン エレクトロニクス カンパニー リミテッド パケット損失隠匿方法及びその装置、並びにそれを適用した復号方法及びその装置

Also Published As

Publication number Publication date
WO2020169754A1 (en) 2020-08-27
US20220189490A1 (en) 2022-06-16
EP3928314A1 (en) 2021-12-29
JP7335968B2 (ja) 2023-08-30
KR20210130743A (ko) 2021-11-01
MX2021009635A (es) 2021-09-08
EP3928313A1 (en) 2021-12-29
US20220172733A1 (en) 2022-06-02
CN113439302A (zh) 2021-09-24
JP2023029834A (ja) 2023-03-07
JP2023166423A (ja) 2023-11-21
JP2023138988A (ja) 2023-10-03
WO2020169757A1 (en) 2020-08-27
CO2021012223A2 (es) 2021-09-30
JP2022521077A (ja) 2022-04-05
US20220148602A1 (en) 2022-05-12
JP7471375B2 (ja) 2024-04-19
WO2020169756A1 (en) 2020-08-27
US11862180B2 (en) 2024-01-02
CN113454713A (zh) 2021-09-28
CO2021010587A2 (es) 2021-08-30
JP7178506B2 (ja) 2022-11-25
US20230298597A1 (en) 2023-09-21
BR112021014477A2 (pt) 2021-09-28
JP2022521494A (ja) 2022-04-08
CN113454714A (zh) 2021-09-28
JP2022521188A (ja) 2022-04-06
EP3928312A1 (en) 2021-12-29
CN113454714B (zh) 2024-05-14
US11705136B2 (en) 2023-07-18

Similar Documents

Publication Publication Date Title
JP5405659B2 (ja) 消去されたスピーチフレームを再構成するためのシステムおよび方法
WO2014052746A1 (en) Position-dependent hybrid domain packet loss concealment
JP7472154B2 (ja) 完全フレーム損失隠蔽および部分的フレーム損失隠蔽を含む、lc3隠蔽のためのデコーダおよび復号方法
US10504525B2 (en) Adaptive forward error correction redundant payload generation
BRPI0718738B1 (pt) Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo
EA025020B1 (ru) Аудиодекодер и способ декодирования с использованием эффективного понижающего микширования
ES2816014T3 (es) Ocultación de error de trama
WO2013061584A1 (ja) 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法
JP2023138988A (ja) 周波数領域パケットロス補償のための方法、および関連デコーダ
JP2022174077A (ja) スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオ・デコーダ、方法及びコンピュータ・プログラム
CN111312261A (zh) 突发帧错误处理
TWI738106B (zh) 用於提供處理後的音訊信號表示的設備、音訊信號處理器、音訊解碼器、音訊編碼器、方法及電腦程式
CN113950719A (zh) 时间反转的音频子帧错误隐藏
Kurniawati et al. Error concealment scheme for MPEG-AAC
CN116978388A (zh) 一种音频数据的处理方法、处理系统和存储介质
OA17404A (en) Frame error concealment.

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211111

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221129

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20230228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230613

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230630

R150 Certificate of patent or registration of utility model

Ref document number: 7307805

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150