JP6099602B2 - 重複変換を使用した情報信号変換装置 - Google Patents

重複変換を使用した情報信号変換装置 Download PDF

Info

Publication number
JP6099602B2
JP6099602B2 JP2014158475A JP2014158475A JP6099602B2 JP 6099602 B2 JP6099602 B2 JP 6099602B2 JP 2014158475 A JP2014158475 A JP 2014158475A JP 2014158475 A JP2014158475 A JP 2014158475A JP 6099602 B2 JP6099602 B2 JP 6099602B2
Authority
JP
Japan
Prior art keywords
information signal
sampling rate
conversion
continuous
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014158475A
Other languages
English (en)
Other versions
JP2014240973A (ja
Inventor
シュネール、マルクス
ガイガー、ラルフ
ラヴェリ、エマニュエル
フォトポウロー、エレニ
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2014240973A publication Critical patent/JP2014240973A/ja
Application granted granted Critical
Publication of JP6099602B2 publication Critical patent/JP6099602B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Description

本発明は重複変換を使用した情報信号変換装置に関し、詳しくは、例えばオーディオ圧縮技術で使用されるようなエイリアシング解消を必要とする情報信号の重複変換を使用した情報信号変換装置に関する。
ほとんどの圧縮技術は、特定の種類の情報信号や、最大許容遅延や可能な送信ビットレートというような圧縮データストリームの特定の条件に合うように設計されている。例えば高いビットレートでスピーチではなく音楽を符号化する場合には、オーディオ圧縮に関して、AACのような変換に基づくコーデックの方が、ACELPのような線形予測に基づく時間領域コーデックよりも優れた性能を示す傾向がある。例えばUSACは、様々なオーディオコーディング原理を一つのコーデックに統合することにより、非常に多様な応用場面に対応しようとするものである。しかし、その利点を利用して、例えばより高いコーディング効率を達成するためには、送信ビットレートの変更というような様々なコーディング条件への適応性をさらに上げることが好ましい。
3GPP「オーディオコーデック処理機能、拡張適応マルチレート−広帯域(AMR−WB)コーデック、トランスコーディング機能」2009年、3GPP TS26.290 USACコーデック(音声合成コーデック)、ISO/IEC CD 23003−3、2010年9月24日
従って、本発明の目標は、重複変換表記を実際の要求に適合させることが可能となるように、エイリアシング解消を必要とする重複変換による情報信号の表記を可能にする情報信号変換装置を提示することにより、このような概念を提供することであり、これにより、より高いコーディング効率を達成することができるであろう。
この目標は独立請求項の内容によって達成される。
本発明につながる主な思想は以下のようなものである。例えばレートと歪みの比の点で情報信号を効率的に符号化する際にプリステートを形成するために、情報信号の重複変換表記がしばしば使用される。このようなコーデックの例はAACやTCX等である。しかし重複変換表記はまた、変換と再変換を様々なスペクトル分解能で連結させることによりリサンプリングを実行するのに使用され得る。一般的に、情報信号の連続する時間領域のウィンドウバージョンの変換形の個々の再変換形の重複部分でエイリアシングが生じる重複変換表記は、重複変換表記をするために符号化されるべき変換係数レベルの個数が少なくなるという点で有利である。極端な状態では、重複変換は「じっくりとサンプリング」されている。つまり、情報信号の時間サンプルの個数に比較して、重複変換表記の係数の個数は増加しない。重複変換表記の一例は、MDCT(修正離散余弦変換)またはQMF(直交ミラーフィルター)フィルターバンクである。従って、情報信号を効率的に符号化する際に、このような重複変換表記をプリステートとして使用することが好ましい場合がしばしばある。しかし、情報信号が重複変換表記される際のサンプリングレートが、例えば可能な送信ビットレートまたは他の環境条件に適合するように時間変動可能であれば、これもまた好ましい。可能送信ビットレートが変動的であると仮定すると、例えば可能送信ビットレートが所定の閾値よりも下がった場合は常にサンプリングレートを下げることが好ましく、可能送信レートが再び上がった場合には、情報信号を重複変換表記するサンプリングレートが上昇可能であることが好ましい。悪いことに、重複変換表記の再変換の重複エイリアシング部分が、このようなサンプリングレート変更に対して障害を設けており、サンプリングレート変更の場合に重複変換表記を完全に遮断することによってのみ、この障害を打開することが可能であるように思われる。しかし、本発明の発明者たちは上述の問題に対する解決を実現し、これにより、エイリアシングと懸案のサンプリングレート変更を伴う重複変換表記の効率的な使用が可能となる。特に、補間によって、情報信号の先行領域及び/または後続領域が、これらの領域の境界でのサンプリングレート変更に従い、エイリアシング解消部分でリサンプリングされる。そして、結合装置は、エイリアシング解消部分でのリサンプリングにより得られるような先行領域の再変換と後続領域の再変換との境界で、エイリアシング解消を行うことができる。この方法により、サンプリングレート変更/推移時点での重複変換信号の中断を引き起こすことなく、サンプリングレート変更に対して効率的に対処することができる。重複変換を適切に生成するために、変換側での同様の方法も可能である。
上述の考えを用いて、オーディオ圧縮技術のような情報信号圧縮技術を提供することが可能であり、これらの技術は、符号化の環境条件の広範囲にわたって、例えば可能転送帯域幅全体にわたって、サンプリングレート変更そのものによる不利益を全く被ることなく、与えられたサンプリングレートをこれらの条件に適合させることにより、高い符号化効率を得ることができるものである。
本発明の利点は、従属請求項に記載の内容である。さらに、本発明の好ましい実施形態を、添付図面を参照し以下に説明する。
本発明の実施形態が適用可能である情報信号エンコーダのブロック図を示す。 本発明の実施形態が適用可能である情報信号デコーダのブロック図を示す。 図1Aのコアエンコーダの可能な内部構成のブロック図を示す。 図1Bのコアデコーダの可能な内部構成のブロック図を示す。 図1Aのリサンプラーの可能な実施例のブロック図を示す。 図1Bのリサンプラーの可能な内部構成のブロック図を示す。 本発明の実施形態が適用された情報信号エンコーダのブロック図を示す。 本発明の実施形態が適用された情報信号デコーダのブロック図を示す。 本発明の一実施形態に係る情報信号再構築装置のブロック図を示す。 本発明の一実施形態に係る情報信号変換装置のブロック図を示す。 図5の情報信号再構築装置が使用された別の実施形態に係る情報信号エンコーダのブロック図を示す。 図5の情報信号再構築装置が使用された別の実施形態に係る情報信号デコーダのブロック図を示す。 本発明の一実施形態に係る図6の情報信号エンコーダ及びデコーダで発生するサンプリングレート変更を示す概略図である。
以下に説明する本発明の実施形態の動機付けために、前もって、本願の実施形態が使用でき、以下で述べるような本発明と本願の実施形態の利点を明らかにする実施形態について議論する。
図1A,1Bは、例えば、以下に説明する実施形態を有利に使用し得る一対のエンコーダとデコーダを示している。図1Aはエンコーダを示し、図1Bはデコーダを示す。図1Aの情報信号エンコーダ10は、情報信号が入力される入力部12と、リサンプラー14と、コアエンコーダ16とを含み、リサンプラー14とコアエンコーダ16は、エンコーダ10の入力部12と出力部18との間で連続的に接続されている。出力部18で、エンコーダ10は入力部12の情報信号を表すデータストリームを出力する。同様に、参照符号20で示された図1Bのデコーダは、コアデコーダ22とリサンプラー24とを含み、コアデコーダ22とリサンプラー24は、図1Bに示されているように、デコーダ20の入力部26と出力部28との間で連続的に接続されている。
出力部18で出力されたデータストリームをデコーダ20の入力部26に送る際に可能な転送ビットレートが高い場合には、データストリーム内で高サンプリングレートで情報信号12を表すことが符号化効率の点で好ましく、これにより、情報信号のスペクトルの広スペクトル帯域をカバーすることができる。つまり、レート/歪み比尺度のような符号化効率尺度によると、情報信号の低サンプリングレートでの圧縮と比較して、コアエンコーダ16がそれよりも高いサンプリングレートで入力信号12を圧縮する場合には、符号化効率が高くなることが示されている。一方、可能転送ビットレートのうちの低い方のビットレートでは、情報信号12を低サンプリングレートで符号化する際に符号化効率尺度はより高くなり得る。この点に関して、歪みは心理音響的に動機づけられた方法で、つまり、知覚的にあまり関係のない周波数領域(それに対する人間の耳の感度が低い周波数領域)内の歪みよりも、知覚的により関連のある周波数領域内の歪みを集中的に考慮して測定してもよいことに留意すべきである。一般的に、低周波領域は高周波領域よりも知覚的に関連深い傾向があり、従って、低サンプリングレート符号化では、入力部12での信号のナイキスト周波数よりも高い周波数成分は符号化の対象から除外される。しかし、その結果ビットレートの節約を得ることができるので、レート/歪み比の点で、この低サンプリングレート符号化は高サンプリングレート符号化よりも好ましいものとなり得る。低周波部分と高周波部分との間の歪みの重要性に関するこれに類似の矛盾は、測定信号などのような他の情報信号内にも存在する。
従って、リサンプラー14は情報信号12をサンプリングする際のサンプリングレートを変更するためのものである。とりわけ出力部18と入力部26との間の可能転送ビットレートにより規定されるような外部転送条件に応じてサンプリングレートを適切に制御することにより、外部転送条件が時間と共に変化するにもかかわらず、エンコーダ10は符号化効率を向上させることができる。そして、デコーダ20はデータストリームを展開するコアデコーダ22を含み、また、リサンプラー24は、出力部28で出力される再構築情報信号が再び一定のサンプリングレートを有するように処理する。
しかし、図1A,1Bのエンコーダ/デコーダ対で重複変換が使用される場合には必ず問題が発生する。再変換の重複領域でエイリアシングが発生する重複変換表記は、効率的な符号化ツールではあるが、時間的エイリアシング解消を必要とするので、サンプリングレート変更の際に問題が発生する。例えば図2A,2Bを参照して下さい。図2A,2Bは、変換符号化タイプのものであると仮定した場合のコアエンコーダ16とコアデコーダ22の可能な実施例を示す。従って、コアエンコーダ16は変換装置30を含み、この後に圧縮装置32が設けられている。図2Bのコアデコーダは展開装置34を含み、この後に今度は再変換装置36が設けられている。図2A,2Bに関して、コアエンコーダ16とコアデコーダ22内には、他に何のモジュールも存在し得ないというように理解すべきではない。例えば、変換装置30の前にフィルターがあってもよく、この場合、変換装置30はリサンプラー14によって与えられたリサンプル情報信号そのままではなく、事前にフィルタリングされた形のものを変換することになる。同様に、再変換装置36の後に、逆変換関数を有するフィルターがあってもよく、この場合、再変換信号は続いて逆フィルタリングされることになる。
圧縮装置32は、変換装置30によって出力された重複変換表記を、ハフマン符号化または算術符号化のような例を含むエントロピーコーディングのようなロスレスコーディングを使用して圧縮し、展開装置34は、再変換装置36へ送られるべき重複変換表記を得るために、例えばハフマン復号または算術復号のようなエントロピーデコーディングにより、まさに逆の処理つまり展開を行う。
図2A,2Bに示した変換符号化環境において、リサンプラー14がサンプリングレートを変更するたびに問題が発生する。この問題は、情報信号12が存在する符号化側においてはあまり深刻ではない。従って、変換装置30には、サンプリングレート変更の瞬間を跨いでも、それぞれの領域のウィンドウバージョンを使用したそれぞれの変換のために継続的にサンプリングされた領域が与えられる。変換装置30の可能な実施形態を、図6を参照して以下に説明する。一般的に、変換装置30には情報信号の先行領域のウィンドウバージョンが現在のサンプリングレートで与えられ、その後、リサンプラー14によって、情報信号の次の部分的重複領域が変換装置30に与えられ、そして、情報信号のウィンドウバージョンの変換形が変換装置30によって生成される。必要な時間的エイリアシング解消処理は変換装置30よりもむしろ再変換装置36において行われなければならないので、さらに追加の問題は起こらない。しかし再変換装置36においては、前述のすぐ後に続く領域の再変換形は様々な異なるサンプリングレートに関連するので、再変換装置36は時間的エイリアシング解消を実行することができないという点で、サンプリングレートの変更が問題を発生させる。以下に説明する実施形態はこれらの問題を解決するものである。これらの実施形態によると、再変換装置36は、以下に記載のような情報信号再構築装置に置き代えられてもよい。
しかし図1A,1Bに関して説明した環境においては、コアエンコーダ16とコアデコーダ22が変換符号化タイプのものである場合にのみ、問題が発生する。より正確には、リサンプラー14と24をそれぞれ形成する重複変換に基づくフィルターバンクを使用した場合にも問題は発生する。例えば図3A,3Bを参照して下さい。図3A,3Bは、リサンプラー14,24を実現するための具体的な一実施形態を示している。図3A,3Bの実施形態によると、どちらのリサンプラーも、解析フィルターバンク38,40とその後に配置された合成フィルターバンク42,44とをそれぞれ連結することにより形成されている。図3A,3Bに示されているように、解析及び合成フィルターバンク38〜44は、QMFフィルターバンク、つまり情報信号を事前に分解し、そして再び信号を結合するためのQMFを使用したMDCTに基づくフィルターバンクとして実施してもよい。このQMFは、10個のブロック重複している(10個は単に一例である)マルチチャンネル変調フィルターバンクを意味するMPEG HE−AACまたはAAC−ELDのSBR部分で使用されているQMFと同様に実施されてもよい。このように、重複変換表記は解析フィルターバンク38,40によって生成され、合成フィルターバンク42,44で、リサンプリングされた信号がこの重複変換表記から再構築される。サンプリングレート変更を可能にするために、合成フィルターバンク42と解析フィルターバンク40は様々な変換長で動作するよう構成されていてもよい。しかし、フィルターバンクまたはQMFのレート、つまり、一方では解析フィルターバンク38,40それぞれによって連続的な変換形が生成され、他方では合成フィルターバンク42,44それぞれによって再変換が行われるレートは一定であり、全ての素子38〜40に関して同じである。変換長の変更は、しかし、サンプリングレートの変更をもたらす。例えば、解析フィルターバンク38と合成フィルターバンク42の対を考えてみる。解析フィルターバンク38は、一定の変換長と一定のフィルターバンクまたは変換レートを使用して動作するものと仮定する。この場合、解析フィルターバンク38によって出力される入力信号の重複変換表記は、入力信号の、連続重複し、一定のサンプル長さを有する領域のそれぞれに関して、それぞれの領域のウィンドウバージョンの変換形を含み、これらの変換形も一定長さを有する。換言すれば、解析フィルターバンク38は一定の時間/周波数分解能のスペクトログラムを合成フィルターバンク42へ送る。しかし、合成フィルターバンクの変換長は変動する。例えば、解析フィルターバンク38の入力部での入力サンプリングレートと合成フィルターバンク42の出力部での信号出力サンプリングレートとの間で、第1のダウンサンプリングレートから第2のダウンサンプリングレートに下げる場合を考える。第1のダウンサンプリングレートが有効である限り、解析フィルターバンク38によって出力された重複変換表記またはスペクトログラムは単に部分的に使用され、合成フィルターバンク42内で再変換をもたらす。合成フィルターバンク42の再変換は、解析フィルターバンク38のスペクトログラム内で連続する変換形の低周波部分に単純に適用される。合成フィルターバンク42の再変換に使用される変換長が短いために、合成フィルターバンク42の再変換形内のサンプル数もまた、それまでフィルターバンク38での変換の対象となっていた重複時間部分でのサンプル数よりも少なく、これにより、解析フィルターバンク38の入力部に入力された情報信号のオリジナルのサンプリングレートに比べて低いサンプリングレートとなる。ダウンサンプリングレートが一定に保たれる限り、合成フィルターバンク42が、連続する再変換形の間の重複部分と、フィルターバンク42の出力部での出力信号の連続重複領域とで、時間的エイリアシング解消を実行することに何の問題もないままなので、何も問題は起こらないだろう。
ダウンサンプリングレートが第1のダウンサンプリングレートからそれよりも高い第2のダウンサンプリングレートに変更される場合には、常に問題が発生する。この場合、合成フィルターバンク42内の再変換で使用される変換長はさらに縮小され、それにより、このサンプリングレート変更時点よりも後のそれぞれの領域に関しては、さらに低いサンプリングレートとなる。このサンプリングレート変更時点の直前の領域に関する再変換と、このサンプリングレート変更時点の直後にリサンプリングされた領域に関する再変換との間での時間的エイリアシング解消が妨げられるので、ここでも、合成フィルターバンク42にとって問題が発生する。従って、変換長可変の解析フィルターバンク40が変換長一定の合成フィルターバンク44の前に備えられている場合には、デコーディングの側でこのような問題は起こらないという考えは、あまり助けにはならない。ここで、合成フィルターバンク44は、様々な異なる周波数分解能ではない一定のQMF/変換レートのスペクトログラムに、つまり、解析フィルターバンク40から合成フィルターバンク44へ異なるまたは時間変動の変換長ではなく、一定のレートで送られた連続する変換形に適合し、全体変換長の高周波部分を0にして、合成フィルターバンク44の全体変換長の低周波部分を保つ。合成フィルターバンク44の出力部で出力される再構築信号のサンプリングレートは一定のサンプリングレートであるので、合成フィルターバンク44によって出力された連続する再変換形の間の時間的エイリアシング解消は問題ではない。
このように、ここでも、図1A,1Bに関して上述したようなサンプリングレートの変更/適合を実行しようとする際に問題があるが、これらの問題は、情報信号の再構築装置のための以下に説明する実施形態に従い図3Aの逆フィルターバンクまたは合成フィルターバンク42を実施することにより、克服できる。
サンプリングレートの適合/変更に関する上記の考えは、符号化されるべき情報信号の高周波部分がそれに従うパラメトリック手法で(例えば、その信号の低周波部分が変換符号化及び/または予測符号化などを使用して符号化されるスペクトル帯域複製(SBR)を使用して)符号化されるコーディング概念を考慮すると、より興味深くなる。例えば情報信号エンコーダと情報信号デコーダの対を示す図4A,4Bを参照して下さい。エンコーディング側では、コアエンコーダ16が、図3Aに示すように実施されるリサンプラー、つまり解析フィルターバンク38と変換長可変の合成フィルターバンク42の連結によって実施されるリサンプラーの後に続く。上述のように、解析フィルターバンク38の入力と合成フィルターバンク42の出力との間の時間変動ダウンサンプリングレートを達成するために、合成フィルターバンク42は一定領域のスペクトルの一部(合成フィルターバンク42の変換長の時間変動長を有する部分)に対して再変換、つまり、解析フィルターバンク38によって出力された一定長と一定変換レート46の変換を行う。時間変動は両矢印によって示されている。解析フィルターバンク38と合成フィルターバンク42の連結によってリサンプリングされた低周波部分50はコアエンコーダ16によって符号化されるが、残りの部分、つまりスペクトル46の残りの周波数部分である高周波部分52は、パラメトリックエンベロープコーダー54でのエンベロープのパラメトリック符号化の対象とされてもよい。このように、コアデータストリーム56は、パラメトリックエンベロープコーダー54によって出力されたパラメトリック符号化データストリーム58を伴う。
デコーディング側では、デコーダも同様にコアデコーダ22を含み、この後に、図3Bに示されているようなリサンプラー、つまり、解析フィルターバンク40とそれに続く合成フィルターバンク44から成り、解析フィルターバンク40は、エンコーディング側での合成フィルターバンク42の変換長の時間変動に同期した時間変動変換長を有するリサンプラーが続く。コアデコーダ22はコアデータストリーム56を受信しそれを復号するが、パラメトリックデータストリーム58を受信し、そこから高周波部分52’を導き出し、可変変換長の低周波部分50、つまりエンコーディング側で合成フィルターバンク42によって使用された変換長の時間変動に同期し、コアデコーダ22によって出力されたサンプリングレートの変動に同期した変換長の低周波部分50を完全なものとするために、パラメトリックエンベロープデコーダ60が設置されている。
図4Aのエンコーダの場合、解析フィルターバンク38が存在していることが利点であり、これにより、リサンプラーの形成のためには単に合成フィルターバンク42を追加するだけでよい。サンプリングレートの切り換えにより、スペクトル46の低周波部分(低周波部分は、単にパラメトリックエンベロープコーディングの対象となる高周波部分と比較して、より正確なコアエンコーディングの対象となる)の割合を適合させることが可能である。特に、この割合は、データストリーム全体を送信するための可能送信帯域幅などのような外部条件に応じて、効率的に制御してもよい。エンコーディング側で制御される時間変動は、例えばそれぞれのサイド情報データによって、デコーディング側に簡単に信号伝達できる。
このように、図1A〜4Bは、時間的エイリアシング解消が必要となる重複変換表記を使用しているにもかかわらず、サンプリングレートの変更を事実上可能にする概念を持っていることが好ましいということを示している。図5は、合成フィルターバンク42または図2Bの再変換装置36を実施するために使用される場合には、上述のような問題を克服し、既に述べたようにサンプリングレート変更などの利点を活用することができる情報信号再構築装置の一実施形態を示す。
図5に示された情報信号再構築装置は再変換装置70とリサンプラー72と結合装置74を含み、これらは、この順番に、情報信号再変換装置80の入力部76と出力部78との間に連続的に接続されている。
図5に示された情報信号再構築装置は、エイリアシング解消を使用して、入力部76で入力された情報信号の重複変換表記から情報信号を再構築するためのものである。つまり、情報信号再構築装置は、入力部76で入力された情報信号の重複変換表記を使用して、出力部78で、時間変動サンプリングレートで情報信号を出力するためのものである。情報信号の重複変換表記は、情報信号のうちの連続する重複時間領域(または時間間隔)のそれぞれに関して、それぞれの領域のウィンドウバージョンの変換形を含む。以下により詳細に説明するように、情報信号再構築装置80は、情報信号90の先行領域84と後続領域86の境界部82で変化するサンプリングレートで情報信号を再構築するよう構成されている。
情報信号再構築装置80の個々のモジュール70〜74の機能性を説明するために、入力部76で入力された情報信号の重複変換表記は一定の時間/周波数分解能を有する、つまり時間と周波数に関して分解能は一定であると予め仮定する。以降、別の状況について説明する。
この仮定によると、重複変換表記は図5の92であると考えられる。そこに示されているように、重複変換表記は、ある変換レートΔtで時間的に連続する一連の変換形を含む。各変換形94は、情報信号のそれぞれの時間領域iのウィンドウバージョンの変換形を表す。特に、表記92のための周波数分解能は時間に関して一定であるので、各変換形94は一定個数の変換係数Nkを含む。これは、表記92は、図5に示されているようにス
ペクトル軸kに沿って厳密に並べられていてもよいNk個のスペクトル成分またはサブバ
ンドを含む情報信号のスペクトログラムであることを、事実上示している。それぞれのスペクトル成分またはサブバンドにおいて、スペクトログラム内の変換係数は変換レートΔtで発生する。
このような一定の時間/周波数分解能を有する重複変換表記92は、例えば、図3Aに示されているようなQMF解析フィルターバンクによって出力される。この場合、各変換係数は複素数値となる。つまり、各変換係数は例えば実部と虚部を有することになる。しかし、重複変換表記92の変換係数は、必ずしも複素数値である必要はなく、純粋なMDCTの場合のように、もっぱら実数値であってもよい。これ以外にも、図5の実施形態はまた、時間領域の重複部分でエイリアシングが発生する他の重複変換表記(その変換形94が重複変換表記92内に連続的に配列されるもの)にも適用可能であることに留意すべきである。
再変換装置70は、各変換形94に関して、連続時間領域84,86に対して各時間エンベロープ96によって示される再変換形を得るために、変換形94に対して再変換を行うよう構成されている。時間エンベロープは、一連の変換形94を生成するために情報信号の前述のような時間領域に適用されるウィンドウに大体相当するものである。先行する時間領域84に関して、図5では、再変換装置70は、重複変換表記92内の領域84に関連する変換形94全体に対して再変換を行ったと仮定している。領域84の再変換形96は、時間領域84全体の時間的長さΔt・a(aは連続する時間領域間の重複部を決定する係数)をサンプリングした例えばNk個のサンプルまたはNkの二倍の個数のサンプルを含む(表記92の変換形94はΔt・aを単位として生成された)。つまり、いずれの場合も、各変換形94を得る元となったウィンドウバージョンを作り上げたのと同じ個数のサンプルを含む。ここで、時間領域84内の時間サンプルの個数と同一の個数(または二倍の個数)と、その時間領域84に属する変換形94内の変換係数の個数は、単に説明のために選択されたものであり、別の実施形態においては、同一(または二倍)は、使用される重複変換の詳細に応じて、両方の数値間の別の一定比に置き代えられてもよい。
ここで、情報信号再構築装置は時間領域84と時間領域86の間で情報信号のサンプリングレートを変更しようとしていることを前提としている。そうすることの動機は外部信号98から生じる。例えば、情報信号再構築装置80が図3A、図4Aの合成フィルターバンク42を実施するために使用される場合、データストリームの転送条件の変更の場合のように、サンプリングレートの変更がより効率的なコーディングを約束する場合には必ず信号98が与えられ得る。
本件の場合、情報信号再構築装置80が時間領域84と86の間でサンプリングレートを下げようとしている前提は、説明のためである。従って、再変換装置70はまた、後続領域86の再変換形100を得るために、この後続領域86のウィンドウバージョンの変換形に対して再変換を行うが、この時、再変換装置70はこの再変換を行うのに短い方の変換長を使用する。より正確には、再変換装置70は、後続領域86の変換に関してだけ、変換係数1…Nk’のうちの最も低い値Nk’への再変換を実行し、これにより得られた再変換形100はより低いサンプリングレートを有することになる。つまり、再変換形100は、Nk(またはNkに相当する割合)の代わりに単にNk’でサンプリングされるこ
とになる。
図5に示されているように、再変換形96と100の間に以下のような問題が起こる。先行領域84の再変換形96と後続領域86の再変換形100は、これらの先行領域84と後続領域86との間の境界部82でのエイリアシング解消部分102で重なる。エイリアシング解消部分の時間的な長さは例えば(a−1)・Δtであるが、このエイリアシング解消部分102内の再変換形96のサンプルの個数は、同じエイリアシング解消部分102内の再変換形100のサンプルの個数とは異なる(この例では、再変換形100のサンプルの個数よりも高くなる)。従って、この時間間隔102で両方の再変換形96と100を重複加算することによる時間的エイリアシング解消は、単純なことではない。
従って、リサンプラー72は再構築装置70と結合装置74の間に接続され、結合装置74は時間的エイリアシング解消を実行する。特に、リサンプラー72は、エイリアシング解消部分102における先行領域84の再変換形96及び/または後続領域86の再変換形100を、境界部82でのサンプリングレート変更に従い、補間により、リサンプリングするよう構成されている。再変換形96が再変換形100よりも早くリサンプラー72の入力部に到達するので、リサンプラー72は先行領域84の再変換形96に対するリサンプリングを行うことが好ましい。つまり、補間104により、エイリアシング解消部分102に含まれている再変換形96の部分が、同じエイリアシング解消部分102内の再変換形100のサンプリング条件またはサンプル位置に相当するように、リサンプリングされる。そして、その時間間隔102内で新しいサンプリングレートでの再構築信号90を得るために、結合装置74は、再変換形96のリサンプルバージョンと再変換形100の同一場所のサンプルを単純に加算するだけでもよい。この場合、出力再構築信号は、時間領域86の最初の部分で前のサンプリングレートから新しいサンプリングレートに変換されたものとなる。しかし、再構築信号90におけるサンプリングレート変更に間に合う別のポイント82を得るために、補間はまた、時間間隔102の前半と後半とで違う方法で行われてもよい。このように、瞬間82は図5では領域84と86の重複部分の中間に示されているが、それは単に説明のためであり、他の実施形態においては、この同じ時間的ポイントは、領域86の最初の部分と領域84の最後の部分との間のどちらも含む部分のどこかにあればよい。
従って、結合装置74は、エイリアシング解消部分102でのリサンプリングによって得られた先行領域84と後続領域86それぞれの再変換形96と100の間でのエイリアシング解消を実行することができる。より正確には、エイリアシング解消部分102でエイリアシングを解消するために、結合装置74は、リサンプラー72によって得られたリサンプルバージョンを使用して、部分102内の再変換形96と100の重複加算処理を行う。情報信号90のサンプリングレートが時間ポイント82で高いサンプリングレートから低いサンプリングレートに変化しても、この重複加算処理により、変換形94を生成するためのウィンドウ処理に沿って、境界部82を渡っても、エイリアシングフリーで連続的に再構築された情報信号90を出力部78で出力することができる。
このように、図5に関する上述の説明から分かるように、先行時間領域84のウィンドウバージョンの変換形94に対して行われた再変換の変換長の、その先行領域84の時間的長さに対する比は、後続時間領域86のウィンドウバージョンに対して行われた再変換の変換長の、その後続領域86の時間的長さに対する比とは、これらの領域84と86との間の境界部82でのサンプリングレート変更に相当する係数分だけ異なっている。上述した例では、この比の変化は外部信号98によって引き起こされたものである。先行領域84と後続領域86の時間的長さは互いに同じであり、再変換装置70は、後続領域86のウィンドウバージョンの変換形94に対する再変換の適用を、例えばNk’番目の変換
係数までの低周波部分に制限するよう構成されたものであるという前提で、説明してきた。もちろん、このような処理は、先行領域84のウィンドウバージョンの変更結果94に対しても可能である。さらに、上述の説明とは対照的に、境界部82でのサンプリングレート変更は逆方向でも可能であり、従って、後続領域86に関しては何の取得も行われず、先行領域84のウィンドウバージョンの変換形94に関してだけ処理が行われてもよい。
より正確には、ここまで、情報信号の領域のウィンドウバージョンの変換形94の変換長と情報信号の領域の時間的長さが一定である場合、つまり、重複変換表記92は一定の時間/周波数分解能を有するスペクトログラムである場合に対する図5の情報信号再構築装置の動作モードを説明してきた。境界部82の位置設定の際に、情報信号再構築装置80は、一例として制御信号98に反応するものとして説明した。
従って、この構成において、図5の情報信号再構築装置80は図3Aのリサンプラー14の一部となり得る。換言すれば、図3Aのリサンプラー14は、情報信号の重複変換表記を出力するフィルターバンク38と、今まで説明してきたような情報信号の重複変換表記からエイリアシング解消を使用して情報信号を再構築するよう構成された情報信号再構築装置80を含む逆フィルターバンクとの連結から成る。従って、例えば、図5の再変換装置70はQMF合成フィルターバンクとして構成することができ、フィルターバンク38はQMF解析フィルターバンクとして実施することができる。
図1A〜4Aの説明から明らかなように、情報信号エンコーダは、コアエンコーダ16または集隗コアエンコーダ16のような圧縮ステージとパラメトリックエンベロープコーダー54に加えて、このようなリサンプラーを含み得る。圧縮ステージは再構築情報信号を圧縮するよう構成されている。図1A〜4Aに示されているように、このような情報信号エンコーダは、例えば可能転送ビットレートに関する外部情報に応じて制御信号98を制御するよう構成されたサンプリングレートコントローラをさらに含み得る。
しかし別の例では、図5の情報信号再構築装置は、重複変換表記内で情報信号の領域のウィンドウバージョンの変換長の変化を検出することにより、領域82の位置を特定するよう構成可能である。この可能な実施例をより明確にするために、入力された重複変換表記の一例が示されている図5の92’を参照して下さい。それによると、表記92’内の連続する変換形94は一定の変換レートΔtで再変換装置70に到着するが、それぞれの変換形の変換長は変化している。図5において、例えば、先行時間領域84のウィンドウバージョンの変換形の変換長(Nk)は、後続領域86のウィンドウバージョンの変換形
の変換長(Nk’)よりも大きいと仮定する。ともかく、再変換装置70は入力データストリームから重複変換表記92’に関する情報をパースし、それに従い、再変換装置70は、情報信号の連続領域のウィンドウバージョンの変換形に対して行われる再変換の変換長を、重複変換表記92’の連続する変換形の変換長に適合させてもよい。従って、再変換装置70は先行時間領域84のウィンドウバージョンの変換形94の再変換のために変換長Nkを使用し、後続時間領域86のウィンドウバージョンの変換形の再変換のために
変換長Nk’を使用してもよい。これにより、前述し、図5の上部中央に示されているよ
うな再変換形の間のサンプリングレートの違いが生じる。従って、図5の情報信号再構築装置80の動作モードに関して、この動作モードは、再変換の変換長を重複変換表記92’内の変換形の変換長に適合させる際の今述べたような違いに加えて、上記説明と一致する。
このように、後者の機能性に従えば、情報信号再構築装置は外部制御信号98に反応する必要はない。むしろ、サンプリングレート変更時点に関する情報を情報信号再構築装置に通知するには、入力されてくる重複変換表記92’で十分である。
今説明したように動作する情報信号再構築装置80は、図2Bの再変換装置36を形成するために使用できる。つまり、情報信号デコーダは、データストリームから情報信号の重複変換表記92’を再構築するよう構成された展開装置34を含んでいてもよい。前述したように、この再構築はエントロピーデコーディングを伴う。変換形94の時間変動変換長は、展開装置34に入力されるデータストリーム内で適切な方法で信号伝達できる。図5に示されているような情報信号再構築装置は再構築装置36として使用できる。図5の情報信号再構築装置は、展開装置によって与えられたような重複変換表記から、エイリアシング解消を使用して情報信号を再構築するよう構成できる。後者の場合、再変換装置70は、再変換を実行するために、例えばIMDCTを使用することもでき、変換形94は複素数値係数よりもむしろ実数値係数によって表される。
このように、上記の実施形態によると多くの利点が達成できる。例えば毎秒8kbから毎秒128kbに渡るような広い範囲の様々なビットレートで動作するオーディオコーデックに関して、最適なサンプリングレートは、図4A,4Bに関して上述したように、ビットレートに依存する場合もある。低いビットレートでは、低周波だけが、例えばACELPや変換コーディングのような、より正確なコーディング方法で符号化されるべきであり、高周波はパラメトリック方法で符号化されるべきである。高いビットレートでは、スペクトル域全体が例えば正確な方法で符号化される。これは、例えば、これらの正確な方法は常に最適な表記で信号を符号化すべきであることを意味している。これらの信号のサンプリングレートは、ナイキスト原理に準じた最も関連性のある信号周波数成分の変換が可能となるよう、最適化されるべきである。ここで示されているサンプリングレートコントローラ120は、情報信号がコアエンコーダ16に送られる際のサンプリングビットレートを、可能転送ビットレートに応じて制御するよう構成され得る。これは、解析フィルターバンクのスペクトルの低周波部分だけをコアエンコーダ16に送ることを意味している。残りの高周波部分はパラメトリックエンベロープコーダー54に送られる。上述したように、サンプリングレートの時間変動と転送ビットレートは問題ではない。
図5の説明は、サンプリングレート変更時に時間的エイリアシング解消の問題に対処するために使用できる情報信号再構築装置に関するものである。また、図1A〜図4Bに関して前述したように、変換器が重複変換表記を生成し、そして図5の情報信号再構築装置にそれを送る図1A〜4Bの装置内で、連続するモジュール間のインターフェースで何らかの対策が行われなければならない。
図6は情報信号変換装置のこのような一実施形態を示す。図6の情報信号変換装置は、一連のサンプルという形態で情報信号を受け取る入力部105と、情報信号の連続重複領域を取得するよう構成された取込み器106と、各連続重複領域が一定のサンプリングレートを有するように(しかし連続重複領域の間ではサンプリングレートは異なっている)、連続重複領域の少なくとも一部に対してリサンプリングを行うよう構成されたリサンプラー107と、連続重複領域に対してウィンドウ処理を行うよう構成されたウィンドウ処理部108と、図6の情報信号変換器の出力部110で出力される重複変換表記92’を構成する一連の変換形94を得るために、ウィンドウ処理された部分に対して個々に変換を行うよう構成された変換器を含む。ウィンドウ処理部108はハフマンウィンドウ等を使用してもよい。
取込み器106は、情報信号の連続重複領域が同じ時間的長さを有するように、例えばそれぞれ20msとなるように、取込みを行う。
取込み器106は一連の情報信号部分をリサンプラー107に送る。入力情報信号が所定の瞬間に第1のサンプリングレートから第2のサンプリングレートに変わる時間変動サンプリングレートであると仮定すると、例えば、リサンプラー107は、図6の111で示されているように、サンプリングレートが第1のサンプリングレートから第2のサンプリングレートに一度変化するように時間的に所定の時点を含む入力されてくる情報信号部分を補間によってリサンプルするよう構成されていてもよい。これをより明確にするために、図6は、サンプリングレートが瞬間113で変わる一連のサンプル112を説明的に示しており、一例として、一定の時間的長さを有する領域114a〜114dが一定の領域オフセット115Δtで取り込まれる。この領域オフセット115Δtは、一定の領域時間的長さと共に、連続領域114a〜114dの間の所定の重複部分を例えば連続する二つの領域ごとに50%の重複となるように規定する。しかし、これは単に一例にすぎない。この瞬間113より前の第1のサンプリングレートはδt1で示され、この瞬間11
3より後のサンプリングレートはδt2で示されている。111で示されているように、リサンプラー107は、例えば、領域114bを一定のサンプリングレートδt1を有するようリサンプリングするが、時間的後続領域114cに対しては、一定のサンプリングレートδt2を有するようにリサンプリングするよう構成されていてもよい。原則的に、リサンプラー107が、時間的に瞬間113を含むそれぞれの領域114b,114cの一部分を補間によってリサンプリングすれば十分であり、それがまだ目標サンプリングレートでなくても構わない。例えば領域114bの場合、リサンプラー107が、領域114bの時間的に瞬間113より後の部分をリサンプリングし、114cの場合には、瞬間113より前の部分だけをリサンプリングすれば十分である。その場合、取り込まれた領域114a〜114dは一定の時間的長さであるので、リサンプリングされた各領域は、それぞれの一定サンプリングレートδt1,δt2に対応した個数の時間サンプルN1,N2を有する。ウィンドウ処理部108は、そのウィンドウまたはウィンドウ長さを各入力部でのこのサンプルの個数に適合させてもよい。同じことが変換器109にも当てはまり、変換器109もその変換長または変換を同じように適合させてもよい。つまり、図6の111で示されている例では、出力部110での重複変換表記は一連の変換形から成り、変換形の長さはそれぞれ異なり、連続領域のサンプルの個数に対して一次従属的に、つまりそれぞれの領域に対して行ったリサンプリングの際のサンプリングレートに対して一次従属的に増加減少する。
リサンプラー107は、それぞれの連続領域114a〜114d内のリサンプリングされるべきサンプル個数が最小となるように、これらの連続領域114a〜114dの間のサンプリングレート変更を記録するよう構成されていてもよい。あるいは、リサンプラー107はこれとは異なるように構成されていてもよい。例えば、リサンプラー107はダウンサンプリングよりもアップサンプリングを選択するまたはその逆であるように構成されていてもよく、つまり、瞬間113と重なる全ての領域が第1のサンプリングレートδt1または第2のサンプリングレートδt2でリサンプリングされるように、リサンプリングを実行するよう構成されていてもよい。
図6の情報信号変換装置は、例えば図2Aの変換装置30を実施するのに使用してもよい。その場合、例えば変換器109はMDCTを実行するよう構成されていてもよい。
これに関して、変換器109によって行われる変換の変換長は、リサンプリングされたサンプルの個数で測定した領域114cのサイズよりも大きくてもよいことに留意すべきである。その場合、ウィンドウ処理部108から出力されたウィンドウ領域を超える変換長の部分は、変換器109による変換を行う前に0にセットされてもよい。
図5の補間104と図6のリサンプラー107内での補間を実現するための可能な実施例を詳細に説明する前に、図1A,1Bのエンコーダとデコーダの可能な実施形態を示す図7A,7Bを参照して下さい。特に、リサンプラー14,24は図3A,3Bに示されているように実施されているが、コアエンコーダ16とコアデコーダ22は、それぞれ、MDCTに基づく変換コーディングとACELPコーディングのようなCELPコーディングとの間で切り換え可能なコーデックとして実施されている。MDCTに基づくコーディング/デコーディングブランチ122,124は、それぞれ、例えばTCXエンコーダとTCXデコーダであってもよい。あるいは、AACコーダー/デコーダ対が使用されてもよい。CELPコーディングのために、ACELPエンコーダ126がコアエンコーダ16の他方のコーディングブランチとなり、ACELPデコーダ128がコアデコーダ22の他方のデコーディングブランチとなっていてもよい。これら両方のコーディングブランチ間での切り換えは、これらのコーディングモジュールの詳細についてその標準テキストに記載しているUSAC[2]またはAMR−WB+[1]の場合のように、フレーム毎に行われ得る。
図7A,7Bのエンコーダとデコーダをさらに詳しい具体例として考え、コーディングブランチ122,126への入力とデコーディングブランチ124,128による再構築のために内部サンプリングレートの切り換えを可能にするスキームを、以下に詳細に説明する。特に、入力部12での入力信号の入力は、例えば32kHzという一定のサンプリングレートであってもよい。この信号は、上述のような方法でQMF解析/合成フィルターバンク対38,42を使用して、すなわち、帯域数に関して1.25または2.5というような適切な解析及び合成比でリサンプリングされてもよく、これは、例えば25.6kHzまたは12.8kHzの専用サンプリングレートを有するコアデコーダ16に入力してくる内部時間信号となる。そして、ダウンサンプリングされた信号は、コーディングブランチのうちのコーディングモードに応じたものを使用して符号化される。コーディングブランチ122では、MDCT表記及び標準的な変換コーディングスキームを使用して符号化され、または、コーディングブランチ126ではACELPを使用して時間領域で符号化される。コアエンコーダ16のコーディングブランチ126,122によってこのように生成されたデータストリームは出力され、デコーディング側に送られ、そこで再構築される。
内部サンプリングレートを切り換えるために、フィルターバンク38,44は、コアエンコーダ16とコアデコーダ22が動作するであろう内部サンプリングレートに従い、フレーム毎に適合されなければならない。図8は考えられるいくつかの切り換え場面を示しているが、ここでは、単にエンコーダとデコーダのMDCTコーディングの道筋を示しているだけである。
特に、図8は、32kHzであると想定されている入力サンプリングレートが25.6kHz、12.8kHz、8kHzのいずれかにダウンサンプリングされるか、その入力サンプリングレートが維持される可能性があることを示している。入力サンプリングレートと内部サンプリングレートとの間の選択されたサンプリングレート比に応じて、フィルターバンク解析とフィルターバンク合成との間の変換長の比が決まる。これらの比は図8の影付きの部分(フィルターバンク38,44では、選択された内部サンプリングレートとは関係なく、それぞれ40個のサブバンド、フィルターバンク42,40では、選択された内部サンプリングレートに応じて、それぞれ40個、32個、16個または10個のサブバンド)から導き出すことができる。コアエンコーダ内で使用されるMDCTの変換長はこのように決定された内部サンプリングレートに適合され、結果的に変換レートまたは変換ピッチ時間間隔が一定または選択された内部サンプリングレートとは無関係となるように適合される。これは例えば常に20msであってもよく、その結果、選択された内部サンプリングレートに応じて、それぞれ640、512、256、160の変換長となる。
上述のような原理を使用して、フィルターバンク切り換えに関する以下の規制に従い、内部サンプリングレートを切り換えることができる。
−切り換えの間にいかなる遅延も追加されない。
−この切り換えつまりサンプリングレート変更は瞬時に行われる。
−切り換えアーチファクトは最低限に抑えられるかまたは少なくとも低減される。
−計算量が小さい。
基本的に、フィルターバンク38〜44とコアコーダー内のMDCTは、フィルターバンクにおいて、コアエンコーダとデコーダのMDCTと比較して、ウィンドウ領域の重複度が高くてもよい重複変換である。例えば、フィルターバンクにおいて10回の重複が適用されてもよく、MDCT122,124において2回の重複が適用されてもよい。重複変換のために、ステートバッファが、解析フィルターバンクとMDCTのための解析ウィンドウバッファとして、また合成フィルターバンクとIMDCTのための重複加算バッファとして説明できる。レート切り換えの際に、これらのステートバッファは、図5,6に関して上述したような方法で、サンプリングレートの切り換えに応じて調整されるべきである。以下に、図5に関して説明した合成側よりもむしろ、図6に関して説明した解析側でも実行され得る補間に関して、以下に詳細に説明する。重複変換のプロトタイプまたはウィンドウが適合されてもよい。切り換えアーチファクトを低減するには、重複変換部のエイリアシング解消特性を保持するためにステートバッファ内の信号成分を保存すべきである。
以下に、リサンプラー72内での補間104の実行方法について詳細に説明する。
以下のように2種類の場合に区分できる。
1)スイッチアップは、先行時間部分84から後続時間部分86へサンプリングレートが増加される処理である。
2)スイッチダウンは、先行時間部分84から後続時間部分86へサンプリングレートが減少される処理である。
例えば12.8kHz(20msごとに256個のサンプル)から32kHz(20msごとに640個のサンプル)へのようなスイッチアップを想定すると、図5に参照符号130で示されているようなリサンプラー72のステートバッファまたはその容量は、サンプリングレート変更に相当する係数(上述の例では2.5)分だけ拡張される必要がある。追加遅延を発生させない拡張のための可能な方法は、例えば、線形補間またはスプライン補間である。つまり、リサンプラー72は、先行時間領域84に関する再変換形96の後部の(時間間隔102に存在するような)サンプルを、ステートバッファ130内ですぐに補間してもよい。ステートバッファは、図5に示されているように、先入れ先出しバッファとして機能してもよい。当然、完全なエイリアシング解消のために必要な全ての周波数成分がこの処理によって得られるわけではないが、例えば0〜6.4kHzのような少なくとも低周波域が何の歪みもなく生成可能であり、これらの周波数は心理音響的な点で最も関連深いものである。
低いサンプリングレートへのスイッチダウンの場合には、線形またはスプライン補間は、また、追加遅延を発生させずにステートバッファを縮小するためにも使用できる。つまり、リサンプラー72は補間によりサンプリングレートを減少させてもよい。しかし、大きい縮小係数でのサンプリングレートへのスイッチダウン、例えば32kHz(20msごとに640個のサンプル)から12.8kHz(20msごとに256個のサンプル)への切り換え(この場合、縮小係数は2.5)は、高周波成分が除去されなければエイリアシング解消をひどく妨害する可能性がある。合成フィルタリングがこの現象に対処してもよく、この合成フィルタリングでは、フィルターバンクまたは再変換装置を「フラッシュ」することにより、高周波成分を除去することができる。これは、切り換えの瞬間にフィルターバンクが少ない周波数成分を合成し、従って、重複加算バッファから高スペクトル成分を取り除いてきれいにすることを意味している。より正確には、先行時間領域84のための第1のサンプリングレートから後続時間領域86のための第2のサンプリングレートへのスイッチダウンを想像して下さい。上記説明から離れて、再変換装置70は、先行時間領域84のウィンドウバージョンの変換形94の周波数成分の全てを再変換の対象とするわけではなく、そうすることによりスイッチダウンに備えるよう構成されている。むしろ、再変換装置70は、変換形94のあまり関係のない高周波成分を例えば0にセットすることにより、あるいは、これらの高周波成分を次第に減衰させるなどしてそれらの再変換に対する影響を減じることで、高周波成分を再変換から除外してもよい。例えば、この処理の対象となる高周波成分は、周波数成分Nk’よりも高いものであってもよい。
従って、結果的に生じた情報信号内では、時間領域84は、意図的に入力部76で入力された重複変換表記で入手可能であった帯域幅よりも低いスペクトル帯域で再構築されたものとなる。しかし、補間処理104にもかかわらず、高周波部分を気付かずに結合装置74内でのエイリアシング解消処理に導入した場合に重複加算処理で起こるであろうエイリアシング問題を避けることができる。
別の例として、高サンプリングレート表記からの切り換えのために適当なステートバッファ内で使用できるように、さらに低サンプリングレート表記も同時に生成可能である。これにより、デシメーション係数(デシメーションが必要な場合)が常に比較的低く(つまり2より小さく)保たれ、妨害となるようなアーチファクトがエイリアシングから起こることはない。前述したように、これが全ての周波数成分を維持するわけではないが、少なくとも、心理音響的に関連のある低周波を維持することになる。
従って、特定の実施形態によれば、USACの低遅延型を得るために、以下の方法でUSACコーデックを修正することができる。最初に、TCXコーディングモードとACELPコーディングモードのみが許可される。AACモードは回避できる。20msのフレーミングを得るために、そのフレーム長を選択できる。そして、動作モード(超広帯域(SWB)、広帯域(WB)、狭帯域(NB)または全帯域幅)とビットレートに応じて、以下のようなシステムパラメータが選択可能である。システムパラメータの概略を以下の表1に示す。
Figure 0006099602
狭帯域(NB)モードに関して、サンプリングレートの増加を避けることができ、内部サンプリングレートを入力サンプリングレートと等しくなるように、つまり8kHzにセットし、それに応じたフレーム長つまりサンプル数160のフレーム長を選択することにより、元に戻すことができる。同様に、広帯域(WB)動作モードの場合には、16kHzを選択し、TCXのためのMDCTのフレーム長を、サンプル数256ではなく、320とすることができる。
特に、動作ポイントのリスト全体を通して、つまりサポートされているサンプリングレート、ビットレート及び帯域幅を通して変更動作を支えることができる。以下の表2に、USACコーデックの予想低遅延型の内部サンプリングレートに関する様々な構成を示す。
Figure 0006099602
サイド情報として、図2A,2Bのリサンプラーを使用する必要はないことに留意すべきである。入力サンプリングレートから専用のコアサンプリング周波数へのリサンプリング機能を負うために、代わりにIIRフィルターセットを設けることができる。これらのIIRフィルター遅延は0.5ms未満であるが、入力周波数と出力周波数との間の比が半端なものであるので、その複雑さは相当なものである。全てのIIRフィルターに関して遅延が同じであると仮定すると、違うサンプリングレート間での変更が可能となる。
従って、図2A,2Bのリサンプラーの実施例を使用することが好ましい。パラメトリックエンベロープモジュール(つまりSBR)のQMFフィルターバンクが、上述したようなリサンプリング機能を実現するための共同作業に加わってもよい。SWBの場合、このことは、SBRエンコーダモジュールにより既に解析ステージが実現されている一方で、合成フィルターバンクステージをエンコーダに付加することになる。デコーダ側では、SBRが使用可能である場合にQMFがアップサンプリング機能を既に負っている。このスキームは他の全ての帯域幅モードにおいても使用可能である。以下の表3に、必要なQMF構成の概略を示す。
Figure 0006099602
入力サンプリング周波数が一定であると仮定すると、QMF合成プロトタイプを変えることにより、内部サンプリングレート間での変更が可能となる。デコーダ側には逆の動作が適用できる。QMF帯域の帯域幅は動作ポイントの全域を通して同じであることに留意すべきである。
本発明のいくつかの態様を装置に関して説明してきたが、これらの態様はまたこれらに相当する方法の説明でもあり、ブロックや装置は方法ステップや方法ステップの特徴に対応する。同様に、方法ステップに関して説明した態様はまた、これらに相当するブロックやアイテムまたはこれらに相当する装置の特徴の説明でもある。これらの方法ステップのうちのいくつかまたは全てが、例えばマイクロプロセッサ、プログラム制御可能なコンピュータや電子回路のようなハードウェア装置により(またはそれを使用して)実施してもよい。いくつかの実施形態において、最も重要な方法ステップのうちの一つまたはそれ以上のものが、このような装置によって実行されてもよい。
実施条件に応じて、本発明の実施形態はハードウェアまたはソフトウェアで実現可能である。これは、例えばフロッピーディスク、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROMやFLASHメモリーなどの、電子読み取り制御可能な信号が中に保存されたデジタル記憶媒体を使用して実施することができ、これらの電子読み取り制御可能な信号は、それぞれの方法が実行できるように、プログラム可能なコンピュータシステムと協働する(または協働可能である)。従って、このようなデジタル記憶媒体はコンピュータ読み取り可能なものであってもよい。
本発明のいくつかの実施形態は、電子読み取り制御可能な信号を有するデータキャリアを含み、これらの電子読み取り制御可能な信号は、ここで説明した方法のうちの一つを実行できるように、プログラム可能なコンピュータシステムと協働可能である。
一般的に、本発明の実施形態は、プログラムコードを備えたコンピュータプログラム製品として実施でき、このプログラム製品がコンピュータで動作した際、このプログラムコードは前述の方法のうちの一つを実行するためのものである。このようなプログラムコードは、例えば機械読み取り可能なキャリアに保存されていてもよい。
他の実施形態は、ここで説明した方法のうちの一つを実行するためのものであり、機械読み取り可能なキャリアに保存されているコンピュータプログラムを含む。
換言すれば、本発明の方法の一実施形態は、従って、コンピュータで動作した際、前述の方法のうちの一つを実行するためのプログラムコードを有するコンピュータプログラムである。
本発明の方法の別の実施形態は、従って、前述の方法のうちの一つを実行するためのコンピュータプログラムを格納しているデータキャリア(またはデジタル媒体またはコンピュータ読み取り可能な媒体)である。
本発明の方法の別の実施形態は、ここで説明した方法のうちの一つを実行するためのコンピュータプログラムを表すデータストリームまたは一連の信号である。このデータストリームまたは一連の信号は、例えばインターネットのようなデータ通信接続を介して送信されるように構成されていてもよい。
さらに別の実施形態は、ここで説明した方法のうちの一つを実行するように構成された、例えばコンピュータやプログラム可能な論理装置のような処理手段を含む。
本発明のさらに別の実施形態は、ここで説明した方法のうちの一つを実行するためのコンピュータプログラムがインストールされているコンピュータを含む。
本発明の別の実施形態は、ここで説明した方法のうちの一つを実行するためのコンピュータプログラムを受信機に転送する(例えば電子的にまたは光学的に)よう構成された装置またはシステムを含む。
いくつかの実施形態において、ここで説明した方法の機能性のうちのいくつかまたは全てを実行するために、プログラム可能な論理装置(例えばフィールドプログラマブルゲートアレイ)を使用してもよい。いくつかの実施形態において、ここで説明した方法のうちの一つを実行するために、フィールドプログラマブルゲートアレイがマイクロプロセッサと協働してもよい。一般的に、これらの方法は何らかのハードウェア装置によって実行されることが好ましい。
上述の実施形態は単に本発明の原理を説明しているにすぎない。ここで説明した配置や詳細に関して様々な修正や変更が当業者には明らかであろう。従って、本発明は以下の特許請求項の範囲によってのみ制限され、上述の実施形態で示された詳細によっては制限されない。

Claims (6)

  1. エイリアシング発生重複変換を使用して情報信号の重複変換表記を生成するよう構成された情報信号変換装置であり、
    一連のサンプルという形態で情報信号を受け取る入力部(105)と、
    情報信号の連続重複領域を取得するよう構成された取込み器(106)と、
    各連続重複領域が一定のサンプリングレートを有するが、連続重複領域の間ではサンプリングレートは異なるように、連続重複領域の少なくとも一部に対して補間によりリサンプリングを行うよう構成されたリサンプラー(107)と、
    情報信号の連続重複領域に対してウィンドウ処理を行うよう構成されたウィンドウ処理部(108)と、
    ウィンドウ処理された領域に対して個々に変換を行うよう構成された変換器(109)を含み、
    取込み器(106)は、情報信号の連続重複領域は時間的に一定の長さであるように、情報信号の連続重複領域の取り込みを行うよう構成されている。
  2. 請求項1に記載の情報信号変換装置であり、取込み器(106)は、情報信号の連続重複領域が時間的に一定のオフセットを有するように、情報信号の連続重複領域の取り込みを行うよう構成されている。
  3. 請求項またはに記載の情報信号変換装置であり、
    一連のサンプルは、所定の瞬間(113)に第1のサンプリングレートから第2のサンプリングレートに変わる変動サンプリングレートを有し、
    リサンプラー(107)は、連続重複領域の一定のサンプリングレートは第1のサンプリングレートから第2のサンプリングレートへ一度だけ変化するように、所定の瞬間に重複している連続重複領域(114b,c)に対してリサンプリングを行うよう構成されている。
  4. 請求項に記載の情報信号変換装置であり、変換器は、ウィンドウ処理された各領域の変換形の変換長を、ウィンドウ処理されたそれぞれの領域のサンプル数に適合させるよう構成されている。
  5. エイリアシング発生重複変換を使用して情報信号の重複変換表記を生成する方法であり、
    一連のサンプルという形態で情報信号を受け取ることと、
    情報信号の連続重複領域を取得することと、
    各連続重複領域が一定のサンプリングレートを有するが、連続重複領域の間ではサンプリングレートは異なるように、連続重複領域の少なくとも一部に対して補間によりリサンプリングを行うことと、
    情報信号の連続重複領域に対してウィンドウ処理を行うことと、
    ウィンドウ処理された領域に対して個々に変換を行うことを含み、
    連続重複領域の取得では、情報信号の連続重複領域は時間的に一定の長さであるように、情報信号の連続重複領域の取り込みを行う。
  6. コンピュータ上で起動された際、請求項に記載の方法をコンピュータに実行させるためのプログラムコードを有するコンピュータプログラム。
JP2014158475A 2011-02-14 2014-08-04 重複変換を使用した情報信号変換装置 Active JP6099602B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161442632P 2011-02-14 2011-02-14
US61/442,632 2011-02-14
PCT/EP2012/052458 WO2012110478A1 (en) 2011-02-14 2012-02-14 Information signal representation using lapped transform

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013519117A Division JP5712288B2 (ja) 2011-02-14 2012-02-14 重複変換を使用した情報信号表記

Publications (2)

Publication Number Publication Date
JP2014240973A JP2014240973A (ja) 2014-12-25
JP6099602B2 true JP6099602B2 (ja) 2017-03-22

Family

ID=71943597

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013519117A Active JP5712288B2 (ja) 2011-02-14 2012-02-14 重複変換を使用した情報信号表記
JP2014158475A Active JP6099602B2 (ja) 2011-02-14 2014-08-04 重複変換を使用した情報信号変換装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013519117A Active JP5712288B2 (ja) 2011-02-14 2012-02-14 重複変換を使用した情報信号表記

Country Status (18)

Country Link
US (1) US9536530B2 (ja)
EP (1) EP2550653B1 (ja)
JP (2) JP5712288B2 (ja)
KR (1) KR101424372B1 (ja)
CN (1) CN102959620B (ja)
AR (1) AR085222A1 (ja)
AU (1) AU2012217158B2 (ja)
BR (1) BR112012029132B1 (ja)
CA (1) CA2799343C (ja)
ES (1) ES2458436T3 (ja)
HK (1) HK1181541A1 (ja)
MX (1) MX2012013025A (ja)
MY (1) MY166394A (ja)
PL (1) PL2550653T3 (ja)
RU (1) RU2580924C2 (ja)
SG (1) SG185519A1 (ja)
TW (2) TWI564882B (ja)
WO (1) WO2012110478A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3111501C (en) * 2011-09-26 2023-09-19 Sirius Xm Radio Inc. System and method for increasing transmission bandwidth efficiency ("ebt2")
US9842598B2 (en) 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
TWI557727B (zh) 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
IN2015MN02784A (ja) 2013-04-05 2015-10-23 Dolby Int Ab
PT3028275T (pt) * 2013-08-23 2017-11-21 Fraunhofer Ges Forschung Aparelho e método para processamento de um sinal de áudio utilizando uma combinação numa faixa de sobreposição
CN110444219B (zh) 2014-07-28 2023-06-13 弗劳恩霍夫应用研究促进协会 选择第一编码演算法或第二编码演算法的装置与方法
US10504530B2 (en) 2015-11-03 2019-12-10 Dolby Laboratories Licensing Corporation Switching between transforms
JP6976277B2 (ja) * 2016-06-22 2021-12-08 ドルビー・インターナショナル・アーベー 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法
WO2018201112A1 (en) * 2017-04-28 2018-11-01 Goodwin Michael M Audio coder window sizes and time-frequency transformations
EP3644313A1 (en) * 2018-10-26 2020-04-29 Fraunhofer Gesellschaft zur Förderung der Angewand Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction
US11456007B2 (en) 2019-01-11 2022-09-27 Samsung Electronics Co., Ltd End-to-end multi-task denoising for joint signal distortion ratio (SDR) and perceptual evaluation of speech quality (PESQ) optimization
US12101613B2 (en) 2020-03-20 2024-09-24 Dolby International Ab Bass enhancement for loudspeakers

Family Cites Families (217)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69232202T2 (de) 1991-06-11 2002-07-25 Qualcomm, Inc. Vocoder mit veraendlicher bitrate
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
SE501340C2 (sv) 1993-06-11 1995-01-23 Ericsson Telefon Ab L M Döljande av transmissionsfel i en talavkodare
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5568588A (en) 1994-04-29 1996-10-22 Audiocodes Ltd. Multi-pulse analysis speech processing System and method
CN1090409C (zh) 1994-10-06 2002-09-04 皇家菲利浦电子有限公司 采用不同编码原理的传送系统
JP3304717B2 (ja) * 1994-10-28 2002-07-22 ソニー株式会社 ディジタル信号圧縮方法及び装置
EP0720316B1 (en) 1994-12-30 1999-12-08 Daewoo Electronics Co., Ltd Adaptive digital audio encoding apparatus and a bit allocation method thereof
SE506379C3 (sv) 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP3317470B2 (ja) 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US5659622A (en) 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
JP3259759B2 (ja) 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
JPH10124092A (ja) 1996-10-23 1998-05-15 Sony Corp 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10214100A (ja) 1997-01-31 1998-08-11 Sony Corp 音声合成方法
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3223966B2 (ja) 1997-07-25 2001-10-29 日本電気株式会社 音声符号化/復号化装置
US6070137A (en) 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
ATE302991T1 (de) 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
GB9811019D0 (en) 1998-05-21 1998-07-22 Univ Surrey Speech coders
US6173257B1 (en) 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6439967B2 (en) 1998-09-01 2002-08-27 Micron Technology, Inc. Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies
SE521225C2 (sv) 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
US6317117B1 (en) 1998-09-23 2001-11-13 Eugene Goff User interface for the control of an audio spectrum filter processor
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US7124079B1 (en) 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
FI114833B (fi) 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
DE19921122C1 (de) 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
JP2003501925A (ja) 1999-06-07 2003-01-14 エリクソン インコーポレイテッド パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置
JP4464484B2 (ja) 1999-06-15 2010-05-19 パナソニック株式会社 雑音信号符号化装置および音声信号符号化装置
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6636829B1 (en) 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
ES2269112T3 (es) 2000-02-29 2007-04-01 Qualcomm Incorporated Codificador de voz multimodal en bucle cerrado de dominio mixto.
US6757654B1 (en) 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
JP2002118517A (ja) * 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
FR2813722B1 (fr) 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
US6847929B2 (en) 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
US6636830B1 (en) * 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
CA2327041A1 (en) 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US7901873B2 (en) 2001-04-23 2011-03-08 Tcp Innovations Limited Methods for the diagnosis and treatment of bone disorders
US7136418B2 (en) * 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US7206739B2 (en) 2001-05-23 2007-04-17 Samsung Electronics Co., Ltd. Excitation codebook search method in a speech coding system
US20020184009A1 (en) 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US20030120484A1 (en) 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
DE10129240A1 (de) * 2001-06-18 2003-01-02 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten
US6941263B2 (en) 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
DE10140507A1 (de) 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
US7711563B2 (en) 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
KR100438175B1 (ko) 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
JP3815323B2 (ja) * 2001-12-28 2006-08-30 日本ビクター株式会社 周波数変換ブロック長適応変換装置及びプログラム
DE10200653B4 (de) * 2002-01-10 2004-05-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2388352A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
CA2388358A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
US7302387B2 (en) 2002-06-04 2007-11-27 Texas Instruments Incorporated Modification of fixed codebook search in G.729 Annex E audio coding
US20040010329A1 (en) * 2002-07-09 2004-01-15 Silicon Integrated Systems Corp. Method for reducing buffer requirements in a digital audio decoder
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
EP1543307B1 (en) 2002-09-19 2006-02-22 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
CN1703736A (zh) 2002-10-11 2005-11-30 诺基亚有限公司 用于源控制可变比特率宽带语音编码的方法和装置
US7343283B2 (en) 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
US7363218B2 (en) 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100463419B1 (ko) 2002-11-11 2004-12-23 한국전자통신연구원 적은 복잡도를 가진 고정 코드북 검색방법 및 장치
KR100465316B1 (ko) 2002-11-18 2005-01-13 한국전자통신연구원 음성 부호화기 및 이를 이용한 음성 부호화 방법
KR20040058855A (ko) 2002-12-27 2004-07-05 엘지전자 주식회사 음성 변조 장치 및 방법
AU2003208517A1 (en) * 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
US7249014B2 (en) 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
US20050021338A1 (en) 2003-03-17 2005-01-27 Dan Graboi Recognition device and system
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
DE10321983A1 (de) * 2003-05-15 2004-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal
ES2354427T3 (es) 2003-06-30 2011-03-14 Koninklijke Philips Electronics N.V. Mejora de la calidad de audio decodificado mediante la adición de ruido.
DE10331803A1 (de) * 2003-07-14 2005-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung
US6987591B2 (en) 2003-07-17 2006-01-17 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry Through The Communications Research Centre Canada Volume hologram
DE10345995B4 (de) * 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
DE10345996A1 (de) * 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
US7418396B2 (en) * 2003-10-14 2008-08-26 Broadcom Corporation Reduced memory implementation technique of filterbank and block switching for real-time audio applications
US20050091044A1 (en) * 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
US20050091041A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
RU2374703C2 (ru) 2003-10-30 2009-11-27 Конинклейке Филипс Электроникс Н.В. Кодирование или декодирование аудиосигнала
WO2005073959A1 (en) * 2004-01-28 2005-08-11 Koninklijke Philips Electronics N.V. Audio signal decoding using complex-valued data
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118834B (fi) 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
CN1930607B (zh) 2004-03-05 2010-11-10 松下电器产业株式会社 差错隐藏装置以及差错隐藏方法
WO2005096274A1 (fr) 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
CA2566368A1 (en) 2004-05-17 2005-11-24 Nokia Corporation Audio encoding with different coding frame lengths
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US8160274B2 (en) 2006-02-07 2012-04-17 Bongiovi Acoustics Llc. System and method for digital signal processing
US7630902B2 (en) 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
KR100656788B1 (ko) 2004-11-26 2006-12-12 한국전자통신연구원 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더
TWI253057B (en) 2004-12-27 2006-04-11 Quanta Comp Inc Search system and method thereof for searching code-vector of speech signal in speech encoder
WO2006079348A1 (en) 2005-01-31 2006-08-03 Sonorit Aps Method for generating concealment frames in communication system
US7519535B2 (en) 2005-01-31 2009-04-14 Qualcomm Incorporated Frame erasure concealment in voice communications
JP4519169B2 (ja) 2005-02-02 2010-08-04 富士通株式会社 信号処理方法および信号処理装置
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
JP5129117B2 (ja) 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 音声信号の高帯域部分を符号化及び復号する方法及び装置
WO2006126844A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
RU2296377C2 (ru) 2005-06-14 2007-03-27 Михаил Николаевич Гусев Способ анализа и синтеза речи
WO2006136901A2 (en) 2005-06-18 2006-12-28 Nokia Corporation System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
EP1895511B1 (en) * 2005-06-23 2011-09-07 Panasonic Corporation Audio encoding apparatus, audio decoding apparatus and audio encoding information transmitting apparatus
KR100851970B1 (ko) 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7610197B2 (en) 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
RU2312405C2 (ru) 2005-09-13 2007-12-10 Михаил Николаевич Гусев Способ осуществления машинной оценки качества звуковых сигналов
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US7536299B2 (en) 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
WO2007080211A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
WO2007083931A1 (en) 2006-01-18 2007-07-26 Lg Electronics Inc. Apparatus and method for encoding and decoding signal
CN101371295B (zh) 2006-01-18 2011-12-21 Lg电子株式会社 用于编码和解码信号的设备和方法
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US7668304B2 (en) 2006-01-25 2010-02-23 Avaya Inc. Display hierarchy of participants during phone call
FR2897733A1 (fr) 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
FR2897977A1 (fr) 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
US20070253577A1 (en) 2006-05-01 2007-11-01 Himax Technologies Limited Equalizer bank with interference reduction
US7873511B2 (en) 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
JP4810335B2 (ja) 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
WO2008007700A1 (fr) 2006-07-12 2008-01-17 Panasonic Corporation Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue
EP2040251B1 (en) 2006-07-12 2019-10-09 III Holdings 12, LLC Audio decoding device and audio encoding device
US7933770B2 (en) 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
CN101512633B (zh) 2006-07-24 2012-01-25 索尼株式会社 毛发运动合成器系统和用于毛发/皮毛流水线的优化技术
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
EP2054876B1 (en) 2006-08-15 2011-10-26 Broadcom Corporation Packet loss concealment for sub-band predictive coding based on extrapolation of full-band audio waveform
US7877253B2 (en) 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
US8126721B2 (en) * 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8417532B2 (en) * 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
US8041578B2 (en) * 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
EP3288027B1 (en) * 2006-10-25 2021-04-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating complex-valued audio subband values
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
JP5171842B2 (ja) * 2006-12-12 2013-03-27 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 時間領域データストリームを表している符号化および復号化のための符号器、復号器およびその方法
FR2911228A1 (fr) 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
FR2911426A1 (fr) 2007-01-15 2008-07-18 France Telecom Modification d'un signal de parole
US7873064B1 (en) 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
US8364472B2 (en) 2007-03-02 2013-01-29 Panasonic Corporation Voice encoding device and voice encoding method
JP5241701B2 (ja) 2007-03-02 2013-07-17 パナソニック株式会社 符号化装置および符号化方法
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP2008261904A (ja) 2007-04-10 2008-10-30 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置、符号化方法および復号化方法
US8630863B2 (en) 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
CN101388210B (zh) 2007-09-15 2012-03-07 华为技术有限公司 编解码方法及编解码器
CN101743586B (zh) * 2007-06-11 2012-10-17 弗劳恩霍夫应用研究促进协会 音频编码器、编码方法、解码器、解码方法
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
KR101513028B1 (ko) 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8185381B2 (en) * 2007-07-19 2012-05-22 Qualcomm Incorporated Unified filter bank for performing signal conversions
CN101110214B (zh) 2007-08-10 2011-08-17 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
CA2698039C (en) * 2007-08-27 2016-05-17 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity spectral analysis/synthesis using selectable time resolution
JP4886715B2 (ja) 2007-08-28 2012-02-29 日本電信電話株式会社 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
US8566106B2 (en) 2007-09-11 2013-10-22 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
CN101425292B (zh) 2007-11-02 2013-01-02 华为技术有限公司 一种音频信号的解码方法及装置
DE102007055830A1 (de) 2007-12-17 2009-06-18 Zf Friedrichshafen Ag Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges
CN101483043A (zh) 2008-01-07 2009-07-15 中兴通讯股份有限公司 基于分类和排列组合的码本索引编码方法
CN101488344B (zh) 2008-01-16 2011-09-21 华为技术有限公司 一种量化噪声泄漏控制方法及装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
AU2009221443B2 (en) * 2008-03-04 2012-01-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for mixing a plurality of input data streams
US8000487B2 (en) 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
FR2929466A1 (fr) 2008-03-28 2009-10-02 France Telecom Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
US8879643B2 (en) 2008-04-15 2014-11-04 Qualcomm Incorporated Data substitution scheme for oversampled data
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
CA2836871C (en) 2008-07-11 2017-07-18 Stefan Bayer Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
CA2871268C (en) 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
MY181231A (en) 2008-07-11 2020-12-21 Fraunhofer Ges Zur Forderung Der Angenwandten Forschung E V Audio encoder and decoder for encoding and decoding audio samples
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2144171B1 (en) 2008-07-11 2018-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
PL2301020T3 (pl) * 2008-07-11 2013-06-28 Fraunhofer Ges Forschung Urządzenie i sposób do kodowania/dekodowania sygnału audio z użyciem algorytmu przełączania aliasingu
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8380498B2 (en) * 2008-09-06 2013-02-19 GH Innovation, Inc. Temporal envelope coding of energy attack signal by using attack point location
US8577673B2 (en) 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
DE102008042579B4 (de) 2008-10-02 2020-07-23 Robert Bosch Gmbh Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
CN102177426B (zh) 2008-10-08 2014-11-05 弗兰霍菲尔运输应用研究公司 多分辨率切换音频编码/解码方案
KR101315617B1 (ko) 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
CN101770775B (zh) 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
UA99878C2 (ru) 2009-01-16 2012-10-10 Долби Интернешнл Аб Гармоническое преобразование, усовершенствованное перекрестным произведением
AR075199A1 (es) 2009-01-28 2011-03-16 Fraunhofer Ges Forschung Codificador de audio decodificador de audio informacion de audio codificada metodos para la codificacion y decodificacion de una senal de audio y programa de computadora
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
CN103366755B (zh) 2009-02-16 2016-05-18 韩国电子通信研究院 对音频信号进行编码和解码的方法和设备
EP2234103B1 (en) 2009-03-26 2011-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device and method for manipulating an audio signal
KR20100115215A (ko) 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
EP3764356A1 (en) * 2009-06-23 2021-01-13 VoiceAge Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
WO2011048117A1 (en) 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
BR112012009490B1 (pt) 2009-10-20 2020-12-01 Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. ddecodificador de áudio multimodo e método de decodificação de áudio multimodo para fornecer uma representação decodificada do conteúdo de áudio com base em um fluxo de bits codificados e codificador de áudio multimodo para codificação de um conteúdo de áudio em um fluxo de bits codificados
BR122020024236B1 (pt) 2009-10-20 2021-09-14 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V. Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio, método para prover uma representação decodificada de um conteúdo de áudio e programa de computador para uso em aplicações de baixo retardamento
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8793126B2 (en) 2010-04-14 2014-07-29 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
TW201214415A (en) 2010-05-28 2012-04-01 Fraunhofer Ges Forschung Low-delay unified speech and audio codec
BR112013020482B1 (pt) 2011-02-14 2021-02-23 Fraunhofer Ges Forschung aparelho e método para processar um sinal de áudio decodificado em um domínio espectral
EP3373296A1 (en) 2011-02-14 2018-09-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise generation in audio codecs

Also Published As

Publication number Publication date
TWI483245B (zh) 2015-05-01
EP2550653B1 (en) 2014-04-02
JP2013531820A (ja) 2013-08-08
JP2014240973A (ja) 2014-12-25
WO2012110478A1 (en) 2012-08-23
CN102959620B (zh) 2015-05-13
AR085222A1 (es) 2013-09-18
TW201246186A (en) 2012-11-16
CA2799343C (en) 2016-06-21
TW201506906A (zh) 2015-02-16
AU2012217158A1 (en) 2012-12-13
RU2580924C2 (ru) 2016-04-10
KR101424372B1 (ko) 2014-08-01
ES2458436T3 (es) 2014-05-05
CA2799343A1 (en) 2012-08-23
US20130064383A1 (en) 2013-03-14
TWI564882B (zh) 2017-01-01
PL2550653T3 (pl) 2014-09-30
US9536530B2 (en) 2017-01-03
SG185519A1 (en) 2012-12-28
HK1181541A1 (en) 2013-11-08
BR112012029132A2 (pt) 2020-11-10
AU2012217158B2 (en) 2014-02-27
JP5712288B2 (ja) 2015-05-07
KR20130007651A (ko) 2013-01-18
CN102959620A (zh) 2013-03-06
RU2012148250A (ru) 2014-07-27
BR112012029132B1 (pt) 2021-10-05
EP2550653A1 (en) 2013-01-30
MX2012013025A (es) 2013-01-22
MY166394A (en) 2018-06-25

Similar Documents

Publication Publication Date Title
JP6099602B2 (ja) 重複変換を使用した情報信号変換装置
CA3076203C (en) Improved harmonic transposition
KR101407120B1 (ko) 오디오 신호를 처리하고 결합된 통합형 음성 및 오디오 코덱(usac)을 위한 보다 높은 시간적 입도를 제공하기 위한 장치 및 방법
JP6132885B2 (ja) 高調波転換
KR20130133843A (ko) 스펙트럼 영역에서 디코딩된 오디오 신호를 처리하기 위한 방법 및 장치
CA3210604A1 (en) Improved harmonic transposition
AU2021204779B2 (en) Improved Harmonic Transposition
AU2023282303B2 (en) Improved Harmonic Transposition

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150609

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160517

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160817

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20160817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20160928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170221

R150 Certificate of patent or registration of utility model

Ref document number: 6099602

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250