JP6202545B2 - 帯域幅拡張周波数帯域信号を予測する方法、および復号デバイス - Google Patents

帯域幅拡張周波数帯域信号を予測する方法、および復号デバイス Download PDF

Info

Publication number
JP6202545B2
JP6202545B2 JP2015554015A JP2015554015A JP6202545B2 JP 6202545 B2 JP6202545 B2 JP 6202545B2 JP 2015554015 A JP2015554015 A JP 2015554015A JP 2015554015 A JP2015554015 A JP 2015554015A JP 6202545 B2 JP6202545 B2 JP 6202545B2
Authority
JP
Japan
Prior art keywords
frequency
frequency band
signal
bandwidth extension
excitation signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015554015A
Other languages
English (en)
Other versions
JP2016507781A (ja
Inventor
▲澤▼新 ▲劉▼
▲澤▼新 ▲劉▼
磊 苗
磊 苗
峰岩 ▲斉▼
峰岩 ▲斉▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=51241110&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP6202545(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2016507781A publication Critical patent/JP2016507781A/ja
Application granted granted Critical
Publication of JP6202545B2 publication Critical patent/JP6202545B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本出願は、2013年1月29日に中国特許庁に出願された、発明の名称を「帯域幅拡張周波数帯域信号を予測する方法、および復号デバイス」とする中国特許出願第201310034240.9号の優先権を主張し、同出願は、その全体が参照によりここに組み込まれる。
本発明の実施形態は、通信技術の分野、特に、帯域幅拡張周波数帯域信号を予測する方法および復号デバイスに関する。
デジタル通信の分野では、電話呼、オーディオおよびビデオ会議、ブロードキャストテレビジョン、ならびにマルチメディア娯楽のような、音声、画像、オーディオ、およびビデオの伝送に対する非常に普及した適用要件がある。オーディオおよびビデオ信号を保存または送信するプロセスにおいて占有されるリソースを減少させるために、オーディオおよびビデオの圧縮および符号化技術が現れている。多数の異なる技術的な分岐がオーディオおよびビデオの圧縮および符号化技術の発達において出現し、ここで、信号が時間領域から周波数領域に変換された後で符号化および処理される技術は、良好な圧縮特性により広く適用され、この技術は、領域変換符号化技術とも呼ばれる。
通信伝送では、オーディオ品質にますます重点が置かれている。したがって、音声品質が確保されるという前提で、音楽信号の品質をできる限り向上させる必要がある。一方、オーディオ信号の情報の量は非常に豊富であり、したがって、従来の音声の符号励振線形予測(Code Excited Linear Prediction、略してCELP)符号化モードは採用することができない。代わりに、一般に、オーディオ信号を処理するために、領域変換符号化のオーディオ符号化技術を使用することによって時間領域信号が周波数領域信号に変換され、それによって、オーディオ信号の符号化品質を向上させる。
既存のオーディオ符号化技術では、一般に、高速フーリエ変換(Fast Fourier Transform、略してFFT)または修正離散コサイン変換(Modified Discrete Cosine Transform、略してMDCT)または離散コサイン変換(Discrete Cosine Transform、略してDCT)のような変換技術を採用することによって、オーディオ信号中の高周波数帯域信号が時間領域信号から周波数領域信号に変換され、次いで、周波数領域信号が符号化される。
低ビットレートの場合、制限された量子化ビットは、全ての量子化されるべきオーディオ信号を量子化できるとは限らない。したがって、符号化デバイスは、オーディオ信号中の比較的重要な低周波数帯域信号を正確に量子化するためにほとんどのビットを使用し、すなわち低周波数帯域信号の量子化パラメータはほとんどのビットを占有する。ほんの少しのビットが、オーディオ信号中の高周波数帯域信号を大まかに量子化および符号化して、高周波数帯域信号の周波数エンベロープを取得するために使用される。次いで、高周波数帯域信号の周波数エンベロープおよび低周波数帯域信号の量子化パラメータが、ビットストリームの形態で復号デバイスに送られる。低周波数帯域信号の量子化パラメータは、励振信号および周波数エンベロープを含み得る。量子化されているとき、最初に、低周波数帯域信号も時間領域信号から周波数領域信号に変換され得る。次いで、周波数領域信号が励振信号に量子化および符号化される。
一般に、復号デバイスは、低周波数帯域信号の、受信ビットストリーム内にある量子化パラメータに従って低周波数帯域信号を復元し、次いで、低周波数帯域信号に従って低周波数帯域信号の励振信号を獲得し、帯域幅拡張(band width extension、略してBWE)技術およびスペクトル充填技術を使用することによって、かつ低周波数帯域信号の励振信号に従って高周波数帯域信号の励振信号を予測し、高周波数帯域信号の、ビットストリーム内にある周波数エンベロープに従って高周波数帯域信号の予測された励振信号を修正して、予測された高周波数帯域信号を取得し得る。ここでは、取得された高周波数帯域信号は周波数領域信号である。
BWE技術では、ビットが割り当てられた最高周波数ビンは、励振信号が復号される最高周波数ビンであり得る。すなわち、どの励振信号も、最高周波数ビンよりも大きい周波数ビンについて復号されない。ビットが割り当てられた最高周波数ビンよりも大きい周波数帯域は高周波数帯域と呼ばれ得る。ビットが割り当てられた最高周波数ビンよりも小さい周波数帯域は、低周波数帯域と呼ばれ得る。低周波数帯域信号の励振信号に従って高周波数帯域信号の励振信号が予測されることは、具体的には、次の通りであり得る。ビットが割り当てられた最高周波数ビンは中心として使用される。低周波数帯域信号の、ビットが割り当てられた最高周波数ビンより小さい励振信号は、ビットが割り当てられた最高周波数ビンよりも大きく帯域幅が低周波数帯域信号の帯域幅に等しい高周波数帯域信号にコピーされる。励振信号は、高周波数帯域信号の励振信号として使用される。
本発明を実現するプロセスでは、発明者は、少なくとも以下の問題が先行技術に存在することを発見した。先行技術における帯域幅拡張周波数帯域信号を予測する前述の方法により、高周波数帯域信号の励振信号は低周波数帯域信号の励振信号に従って予測され、異なる低周波数帯域信号の励振信号は、異なるフレーム内の同じ高周波数帯域信号にコピーされ得、励振の不連続性を引き起こし、予測された帯域幅拡張周波数帯域信号の品質を低下させ、それによって、オーディオ信号の聴覚品質を減少させる。
本発明の実施形態は、予測された帯域幅拡張周波数帯域信号の品質を改善し、それによって、オーディオ信号の聴覚品質を向上させるように、帯域幅拡張周波数帯域信号を予測する方法および復号デバイスを提供する。
第1の態様によれば、本発明の一実施形態は、帯域幅拡張周波数帯域信号を予測する方法であって、
受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して、周波数領域信号を取得するステップと、
周波数領域信号の、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいかどうか判定するステップと、
ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいとき、周波数領域信号の所定の周波数帯域範囲内の励振信号および帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測するステップと、
ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも大きいまたはこれに等しいとき、周波数領域信号の所定の周波数帯域範囲内の励振信号、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン、およびビットが割り当てられた最高周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測するステップと、
帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って、帯域幅拡張周波数帯域信号を予測するステップと
を含む方法を提供する。
第1の態様を参照して、第1の態様の第1の実現形態では、周波数領域信号の所定の周波数帯域範囲内の励振信号および帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンに従って帯域幅拡張周波数帯域の励振信号を予測するステップは、
周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nは0よりも大きい整数または非整数であり、nは、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の周波数ビンの数量の、周波数領域信号の所定の周波数帯域範囲内の周波数ビンの数量に対する比に等しい、ステップ
を含む。
第1の態様および第1の態様の前述の実現形態を参照して、第1の態様の第2の実現形態では、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップは、
予測が、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンから開始されるとき、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nの非整数部分は1よりも小さい、ステップ、または
予測が、帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nの非整数部分は1よりも小さい、ステップ
を含む。
第1の態様を参照して、第1の態様の第3の実現形態では、周波数領域信号の所定の周波数帯域範囲内の励振信号、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン、および周波数領域信号の、ビットが割り当てられた最高周波数ビンに従って帯域幅拡張周波数帯域の励振信号を予測するステップは、
周波数領域信号の所定の周波数帯域範囲の開始周波数ビンfexc_startより上のm番目の周波数ビンfexc_start+から周波数領域信号の所定の周波数帯域範囲の終了周波数ビンfexc_endまでの励振信号のコピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号の2つの部分を、周波数領域信号の、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nは0または0よりも大きい整数もしくは非整数であり、mはビットが割り当てられた最高周波数ビンと拡張周波数帯域のあらかじめ設定された開始周波数ビンとの間の周波数ビンの数量の値に等しい、ステップ
を含む。
第1の態様および第1の態様の前述の実現形態を参照して、第1の態様の第4の実現形態では、周波数領域信号の周波数帯域範囲内のfexc_start+(ビットが割り当てられた最高周波数ビン〜帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン)からfexc_endまでの励振信号のコピーおよび周波数領域信号のfexc_startからfexc_endまでの周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号の2つの部分を、周波数領域信号の、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップは、
予測が、ビットが割り当てられた最高周波数ビンから開始されるとき、周波数領域信号の周波数帯域範囲内のfexc_start+(ビットが割り当てられた最高周波数ビン〜帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン)からfexc_endまでの励振信号のコピー、周波数領域信号のfexc_startからfexc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける整数コピー、および周波数領域信号のfexc_startからfexc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nの非整数部分は1よりも小さい、ステップ、または
予測が、帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、周波数領域信号のfexc_startからfexc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピー、周波数領域信号のfexc_startからfexc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける整数コピー、および周波数領域信号の周波数帯域範囲内のfexc_start+(ビットが割り当てられた最高周波数ビン〜帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン)からfexc_endまでの励振信号のコピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の高周波数励振信号として使用するステップであって、nの非整数部分は1よりも小さい、ステップ
を含む。
第1の態様および第1の態様の前述の実現形態を参照して、第1の態様の第5の実現形態では、帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って帯域幅拡張周波数帯域信号を予測するステップの前に、方法は、ビットストリームを復号して、帯域幅拡張周波数帯域の周波数エンベロープを取得するステップをさらに含む。
第1の態様および第1の態様の前述の実現形態を参照して、第1の態様の第6の実現形態では、帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って帯域幅拡張周波数帯域信号を予測するステップの前に、方法は、
ビットストリームを復号して、信号タイプを取得するステップと、
信号タイプに従って帯域幅拡張周波数帯域の周波数エンベロープを獲得するステップと
をさらに含む。
第1の態様および第1の態様の前述の実現形態を参照して、第1の態様の第7の実現形態では、信号タイプに従って帯域幅拡張周波数帯域の周波数エンベロープを獲得するステップは、
信号タイプが非高調波信号であるとき、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して帯域幅拡張周波数帯域の周波数エンベロープを取得するステップ、または
信号タイプが高調波信号であるとき、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して帯域幅拡張周波数帯域の初期周波数エンベロープを取得し、初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープについて重み付け計算を実行することによって取得された値を帯域幅拡張周波数帯域の周波数エンベロープとして使用するステップであって、Nは1よりも大きいまたはこれに等しい、ステップ
を含む。
第2の態様によれば、本発明の一実施形態は、
受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して、周波数領域信号を取得するように構成された復号モジュールと、
周波数領域信号の、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいかどうか判定するように構成された判定モジュールと、
判定モジュールが、ビットが割り当てられた最高周波数ビンは帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいと判定したとき、周波数領域信号の所定の周波数帯域範囲内の励振信号および帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測するように構成された第1の処理モジュールと、
判定モジュールが、ビットが割り当てられた最高周波数ビンは帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも大きいまたはこれに等しいと判定したとき、周波数領域信号の所定の周波数帯域範囲内の励振信号、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン、およびビットが割り当てられた最高周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測するように構成された第2の処理モジュールと、
帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って帯域幅拡張周波数帯域信号を予測するように構成された予測モジュールと
を含む復号デバイスを提供する。
第2の態様を参照して、第2の態様の第1の実現形態では、第1の処理モジュールは、具体的には、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nは0よりも大きい整数または非整数であり、nは、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の周波数ビンの数量の、周波数領域信号の所定の周波数帯域範囲内の周波数ビンの数量に対する比に等しい。
第2の態様および第2の態様の前述の実現形態を参照して、第2の態様の第2の実現形態では、第1の処理モジュールは、具体的には、予測が、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンから開始されるとき、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nの非整数部分は1よりも小さい、または
第1の処理モジュールは、具体的には、予測が、帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nの非整数部分は1よりも小さい。
第2の態様を参照して、第2の態様の第3の実現形態では、第2の処理モジュールは、具体的には、周波数領域信号の所定の周波数帯域範囲の開始周波数ビンfexc_startより上のm番目の周波数ビンから周波数領域信号の所定の周波数帯域範囲の終了周波数ビンfexc_endまでの励振信号のコピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号の2つの部分を、周波数領域信号の、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nは0または0よりも大きい整数もしくは非整数であり、mはビットが割り当てられた最高周波数ビンと拡張周波数帯域のあらかじめ設定された開始周波数ビンとの間の周波数ビンの数量の値である。
第2の態様および第2の態様の前述の実現形態を参照して、第2の態様の第4の実現形態では、第2の処理モジュールは、具体的には、予測が、ビットが割り当てられた最高周波数ビンから開始されるとき、周波数領域信号の周波数帯域範囲内のfexc_start+(ビットが割り当てられた最高周波数ビン〜帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン)からfexc_endまでの励振信号のコピー、周波数領域信号のfexc_startからfexc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける整数コピー、および周波数領域信号のfexc_startからfexc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nの非整数部分は1よりも小さい、または
第2の処理モジュールは、具体的には、予測が、帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、周波数領域信号のfexc_startからfexc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピー、周波数領域信号のfexc_startからfexc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける整数コピー、および周波数領域信号の周波数帯域範囲内のfexc_start+(ビットが割り当てられた最高周波数ビン〜帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン)からfexc_endまでの励振信号のコピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の高周波数励振信号として使用するように構成され、nの非整数部分は1よりも小さい。
第2の態様および第2の態様の前述の実現形態を参照して、第2の態様の第5の実現形態では、復号モジュールは、予測モジュールが帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って帯域幅拡張周波数帯域信号を予測する前に、ビットストリームを復号して、帯域幅拡張周波数帯域の周波数エンベロープを取得するようにさらに構成される。
第2の態様および第2の態様の前述の実現形態を参照して、第2の態様の第6の実現形態では、デバイスは獲得モジュールをさらに含み、
復号モジュールは、予測モジュールが帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って帯域幅拡張周波数帯域信号を予測する前に、ビットストリームを復号して、信号タイプを取得するようにさらに構成され、
獲得モジュールは、信号タイプに従って帯域幅拡張周波数帯域の周波数エンベロープを獲得するように構成される。
第2の態様および第2の態様の前述の実現形態を参照して、第2の態様の第7の実現形態では、獲得モジュールは、具体的には、信号タイプが非高調波信号であるとき、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して、帯域幅拡張周波数帯域の周波数エンベロープを取得するように構成され、または
獲得モジュールは、具体的には、信号タイプが高調波信号であるとき、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して帯域幅拡張周波数帯域の初期周波数エンベロープを取得し、初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープについて重み付け計算を実行することによって取得された値を帯域幅拡張周波数帯域の周波数エンベロープとして使用するように構成され、Nは1よりも大きいまたはこれに等しい。
本発明の実施形態における帯域幅拡張周波数帯域信号を予測する方法および復号デバイスにより、帯域幅拡張の開始周波数ビンが設定され、周波数領域信号が復号される最高周波数ビンと開始周波数ビンが比較され、帯域幅拡張周波数帯域の励振復元を実行し、それによって、拡張された励振信号はフレーム間で連続しており、復号された励振信号の周波数ビンが維持され、それによって、復元された帯域幅拡張周波数帯域信号の聴覚品質を確保し、出力オーディオ信号の聴覚品質を向上させる。
本発明の実施形態における、または先行技術における技術的解決策をより明確に説明するために、以下は、実施形態または先行技術を説明するために必要とされる添付の図面を簡単に紹介する。明らかに、以下の説明における添付の図面は本発明のいくつかの実施形態を示し、この技術分野の当業者は、創作的な労力なしで、これらの添付の図面から他の図面を依然として導き出し得る。
先行技術における符号化デバイスの概略構造図である。 先行技術における復号デバイスの概略構造図である。 本発明の一実施形態による、帯域幅拡張周波数帯域信号を予測する方法のフローチャートである。 本発明のもう1つの実施形態による、帯域幅拡張周波数帯域信号を予測する方法のフローチャートである。 本発明の一実施形態による周波数帯域の概略図である。 本発明の一実施形態による周波数帯域の概略図である。 本発明の一実施形態による復号デバイスの概略構造図である。 本発明のもう1つの実施形態による復号デバイスの概略構造図である。 本発明のもう1つの実施形態による復号デバイス80のブロック図である。
本発明の実施形態の目的、技術的解決策、および利点をより明確にするために、以下は、本発明の実施形態における添付の図面を参照して、本発明の実施形態における技術的解決策を明確かつ十分に説明する。明らかに、説明される実施形態は本発明の実施形態のうちのいくつかであり、全てではない。創作的な労力なしで本発明の実施形態に基づいてこの技術分野の当業者によって取得される他の全ての実施形態は、本発明の保護範囲に含まれるものとする。
デジタル信号処理の分野では、オーディオコーデックおよびビデオコーデックが、携帯電話、ワイヤレス装置、携帯情報端末(PDA)、ハンドヘルドまたはポータブルコンピュータ、GPS受信機/ナビゲータ、カメラ、オーディオ/ビデオプレーヤ、カムコーダ、ビデオレコーダ、およびモニタリングデバイスのようなさまざまな電子デバイスに広く適用されている。一般に、このタイプの電子デバイスはオーディオ符号化器またはオーディオ復号器を含み、ここで、オーディオ符号化器または復号器は、DSP(digital signal processor)のようなデジタル回路またはチップによって直接実現されてもよいし、ソフトウェアコードによってプロセッサを駆動してソフトウェアコード内のプロセスを実行することによって実現されてもよい。
たとえば、オーディオ符号化器は、最初に、入力信号についてフレーミング処理を実行して、1フレームが20ミリ秒である時間領域データを取得し、次いで、時間領域データについてウィンドーイング(windowing)処理を実行してウィンドーイング後の信号を取得し、ウィンドーイング後の時間領域信号について周波数領域変換を実行して信号を時間領域から周波数領域に変換し、周波数領域信号を符号化し、符号化された周波数領域信号を復号器側に送信する。符号化器側によって送信された圧縮ビットストリームを受信した後、復号器側は、信号について対応する復号動作を実行し、復号することによって取得された周波数領域信号について符号化側によって使用された変換に対応する逆変換を実行して信号を周波数領域から時間領域に変換し、時間領域信号について後処理を実行して合成信号すなわち復号器側によって出力された信号を取得する。
図1は、先行技術における符号化デバイスの概略構造図である。図1に示されるように、先行技術の符号化デバイスは、時間-周波数変換モジュール10と、エンベロープ抽出モジュール11と、エンベロープ量子化および符号化モジュール12と、ビット割り当てモジュール13と、励振生成モジュール14と、励振量子化および符号化モジュール15と、多重化モジュール16とを含む。
図1に示されるように、時間-周波数変換モジュール10は、入力オーディオ信号を受信し、次いで、オーディオ信号を時間領域信号から周波数領域信号に変換するように構成される。次いで、エンベロープ抽出モジュール11が、時間-周波数変換モジュール10による変換によって取得された周波数領域信号から周波数エンベロープを抽出し、ここで、周波数エンベロープは、サブバンド正規化因子と呼ばれ得る。ここでは、周波数エンベロープは、周波数領域信号中の低周波数帯域信号の周波数エンベロープおよび高周波数帯域信号の周波数エンベロープを含む。エンベロープ量子化および符号化モジュール12は、エンベロープ抽出モジュール11によって取得された周波数エンベロープについて量子化および符号化処理を実行し、量子化および符号化された周波数エンベロープを取得する。ビット割り当てモジュール13は、量子化された周波数エンベロープに従って、各サブバンドのビット割り当てを決定する。励振生成モジュール14は、エンベロープ量子化および符号化モジュール12によって取得された量子化および符号化されたエンベロープに関する情報を使用することによって、時間-周波数変換モジュール10によって取得された周波数領域信号について正規化処理を実行して励振信号すなわち正規化された周波数領域信号を取得する。励振信号も、高周波数帯域信号の励振信号および低周波数帯域信号の励振信号を含む。励振量子化および符号化モジュール15は、ビット割り当てモジュール13によって割り当てられた各サブバンドのビット割り当てに従って、励振生成モジュール14によって生成された励振信号について量子化および符号化処理を実行して量子化された励振信号を取得する。多重化モジュール16は、エンベロープ量子化および符号化モジュール12によって量子化された、量子化された周波数エンベロープと励振量子化、および符号化モジュール15によって量子化された、量子化された励振信号をビットストリームに個別に多重化し、ビットストリームを復号デバイスに出力する。
図2は、先行技術における復号デバイスの概略構造図である。図2に示されるように、既存の復号デバイスは、逆多重化モジュール20と、周波数エンベロープ復号モジュール21と、ビット割り当て獲得モジュール22と、励振信号復号モジュール23と、帯域幅拡張モジュール24と、周波数領域信号復元モジュール25と、周波数-時間変換モジュール26とを含む。
図2に示されるように、逆多重化モジュール20は、符号化デバイス側によって送られたビットストリームを受信し、ビットストリームを逆多重化して(復号を含む)量子化された周波数エンベロープおよび量子化された励振信号を個別に取得する。周波数エンベロープ復号モジュール21は、逆多重化モジュール20による逆多重化によって取得された信号から、量子化された周波数エンベロープを獲得し、量子化および復号を実行して周波数エンベロープを取得する。ビット割り当て獲得モジュール22は、周波数エンベロープ復号モジュール21によって取得された周波数エンベロープに従って各サブバンドのビット割り当てを決定する。励振信号復号モジュール23は、逆多重化モジュール20による逆多重化によって取得された信号から、量子化された励振信号を獲得し、各サブバンドの、ビット割り当て獲得モジュール22によって取得されたビット割り当てに従って、量子化および復号を実行して励振信号を取得する。帯域幅拡張モジュール24は、励振信号復号モジュール23によって取得された励振信号に従って帯域幅全体について拡張を実行する。具体的には、高周波数帯域信号の励振信号は、低周波数帯域信号の励振信号を使用することによって拡張される。励振信号およびエンベロープ信号を量子化および符号化するとき、励振量子化および符号化モジュール15およびエンベロープ量子化および符号化モジュール12は、ほとんどのビットを使用して比較的重要な低周波数帯域信号の信号を量子化し、少しのビットを使用して高周波数帯域信号の信号を量子化し、高周波数帯域信号の励振信号は除外すらされ得る。したがって、帯域幅拡張モジュール24は、低周波数帯域信号の励振信号を使用して高周波数帯域信号の励振信号を拡張する必要があり、それによって、周波数帯域全体の励振信号を取得する。周波数領域信号復元モジュール25は周波数エンベロープ復号モジュール21および帯域幅拡張モジュール24に個別に接続され、周波数領域信号復元モジュール25は、周波数エンベロープ復号モジュール21によって取得された周波数エンベロープ、および周波数帯域全体の、帯域幅拡張モジュール24によって取得された励振信号に従って、周波数領域信号を復元させる。周波数-時間変換モジュール26は、周波数領域信号復元モジュール25によって復元された周波数領域信号を時間領域信号に変換し、それによって、最初に入力されたオーディオ信号を取得する。
図1および図2は、先行技術における符号化デバイスおよび対応する復号デバイスの構造図である。図1および図2に示される先行技術における符号化デバイスおよび復号デバイスの処理プロセスによれば、先行技術では、低周波数帯域信号の、復号デバイスが低周波数帯域信号の周波数領域信号を復元するときに使用される、励振信号およびエンベロープ情報が符号化デバイス側によって送られることが知られ得る。したがって、低周波数帯域信号の周波数領域信号の復元は比較的正確である。高周波数帯域信号の周波数領域信号では、まず、低周波数帯域信号の励振信号を使用して高周波数帯域信号の励振信号を予測し、次いで、高周波数帯域信号の、符号化デバイス側によって送られるエンベロープ情報を使用して、高周波数帯域信号の予測された励振信号を修正する必要があり、それによって、高周波数帯域信号の周波数領域信号を取得する。高周波数帯域信号の周波数領域信号を予測するとき、符号化デバイスは、信号タイプを考慮せず、同じ周波数エンベロープを使用する。たとえば、信号タイプが高調波であるとき、使用される周波数エンベロープによってカバーされるサブバンド範囲は、比較的狭い(1つの高調波の頂から谷までカバーされるサブバンド範囲よりも小さい)。周波数エンベロープが、高周波数帯域信号の予測される励振を修正するために使用されるとき、より多くのノイズがもたらされ、したがって、修正によって取得された高周波数帯域信号と実際の高周波数帯域信号との間に比較的大きな誤差が存在し、高周波数帯域信号を予測する精度に著しく影響し、予測される高周波数帯域信号の品質を低下させ、オーディオ信号の聴覚品質を低下させる。さらに、低周波数帯域信号の励振信号に従って高周波数帯域信号の励振信号が予測される前述の先行技術を使用することによって、異なる低周波数帯域信号の励振信号が異なるフレームの同じ高周波数帯域信号にコピーされ得、励振の不連続性を引き起こし、予測された高周波数帯域信号の品質を低下させ、それによって、オーディオ信号の聴覚品質を低下させる。したがって、本発明の実施形態の以下の技術的解決策は、前述の技術的問題を解決するために使用され得る。
図3は、本発明の一実施形態による、帯域幅拡張周波数帯域信号を予測する方法のフローチャートである。この実施形態では、帯域幅拡張周波数帯域信号を予測する方法は、復号デバイスによって実行され得る。図3に示されるように、この実施形態では、帯域幅拡張周波数帯域信号を予測する方法は、具体的には、以下のステップを含み得る。
100。復号デバイスは、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して周波数領域信号を取得する。
101。復号デバイスは、周波数領域信号の、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいかどうか判定する。ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいとき、ステップ102を実行する。そうでない場合、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも大きいまたはこれに等しいとき、ステップ103を実行する。
102。復号デバイスは、周波数領域信号の所定の周波数帯域範囲内の励振信号および帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測し、ステップ104を実行する。
103。復号デバイスは、周波数領域信号の所定の周波数帯域範囲内の励振信号、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン、およびビットが割り当てられた最高周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測し、ステップ104を実行する。
104。復号デバイスは、帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って、帯域幅拡張周波数帯域信号を予測する。
この実施形態における帯域幅拡張周波数帯域信号を予測する方法により、帯域幅拡張の開始周波数ビンが設定され、周波数領域信号が復号される最高周波数ビンと開始周波数ビンが比較されて帯域幅拡張周波数帯域の励振復元を実行し、それによって、拡張された励振信号はフレーム間で連続しており、復号された励振信号の周波数ビンが維持され、それによって、復元された帯域幅拡張周波数帯域信号の聴覚品質を確保し、出力オーディオ信号の聴覚品質を向上させる。
任意選択で、前述の実施形態の技術的解決策に基づいて、図3に示される実施形態の拡張実施形態を形成するために、以下の拡張技術的解決策も含まれ得る。この拡張実施形態では、ステップ100の前に、具体的には、方法は、以下をさらに含み得る。
(a)復号デバイスは、符号化デバイスによって送られたビットストリームを受信し、ここで、ビットストリームは、低周波数帯域信号の量子化パラメータおよび帯域幅拡張周波数帯域信号の周波数エンベロープを搬送する。この実施形態では、低周波数帯域信号の量子化パラメータは、低周波数帯域信号を一意に識別するために使用される。
(b)復号デバイスは、低周波数帯域信号の量子化パラメータに従って低周波数帯域信号の励振信号を獲得する。
具体的には、低周波数帯域信号の量子化パラメータに従って復号デバイスによって低周波数帯域信号の励振信号を獲得する具体的なプロセスについては、先行技術を参照されたい。たとえば、低周波数帯域信号の量子化パラメータが低周波数帯域信号の励振信号および低周波数帯域信号の周波数エンベロープであるとき、復号デバイスが低周波数帯域信号の量子化パラメータに従って低周波数帯域信号の励振信号を獲得することは、具体的には、以下であり得る。復号デバイスは、まず、低周波数帯域信号の励振信号および低周波数帯域信号の周波数エンベロープに従って低周波数帯域信号(ここでは、低周波数帯域信号は周波数領域信号である)を復元し、次いで、低周波数帯域信号について自己適応型正規化処理を実行して低周波数帯域信号の励振信号を取得する。低周波数帯域信号の、量子化パラメータ内にある励振信号を使用して、帯域幅拡張周波数帯域信号の励振信号が高周波数帯域信号のエネルギー要件を満たすことができることを予測するとき、低周波数帯域信号の、量子化パラメータ内にある励振信号は、帯域幅拡張周波数帯域の励振信号を予測するために直接使用され得る。
自己適応型正規化処理の前述の形態は、以下のいくつかの形態を使用し得る。
(1)復号デバイスは、(低周波数帯域信号の励振信号および低周波数帯域信号の周波数エンベロープのような)低周波数帯域信号の復号された量子化パラメータを使用することによって低周波数帯域信号を復元し、移動ウィンドウが周波数領域係数内に設定され、各移動ウィンドウ内の周波数領域係数振幅の平均値が計算され、ここで、計算された平均値の数量は低周波数帯域信号の周波数領域係数の数量と同じであり、低周波数帯域信号(周波数領域信号)は、周波数領域係数振幅の対応する平均値で除算されて、低周波数帯域信号の励振信号を取得する。たとえば、低周波数帯域信号は、N1個の周波数領域係数を有する。第1の周波数領域係数から第10の周波数領域係数の平均値が計算され、第2の周波数領域係数から第11の周波数領域係数の平均値が計算され、第3の周波数領域係数から第12の周波数領域係数の平均値が計算される。アナロジーによって、N1個の平均値が計算される。次いで、N1個の低周波数帯域信号(周波数領域信号)が、対応する平均値で除算されて、低周波数帯域信号(周波数領域信号)の励振信号を取得する。
(2)復号デバイスが、(低周波数帯域信号の励振信号および低周波数帯域信号の周波数エンベロープのような)低周波数帯域信号の量子化パラメータを復号することによって、低周波数帯域信号(周波数領域信号)を復元する。高調波信号について、低周波数帯域信号のN(N>1)個の隣接する周波数エンベロープの平均値が計算され、N個の隣接するサブバンドの周波数エンベロープとして使用され、N個の隣接するサブバンドの全ての周波数領域信号は平均値で除算されて、N個の隣接するサブバンドの低周波数帯域信号の励振信号を取得する。アナロジーによって、低周波数帯域信号全体の励振信号が計算される。非高調波信号について、低周波数帯域信号の各サブバンドは、M(M>1)個の小さいサブバンドにさらに分割され、周波数エンベロープが、各々の小さいサブバンドについてさらに計算され、小さいサブバンドの周波数領域信号が、小さいサブバンドの計算された周波数エンベロープによって分割されて、小さいサブバンドの励振信号を取得する。アナロジーによって、低周波数帯域信号全体の励振信号が取得される。自己適応型正規化処理の詳細なプロセスについては、先行技術の記載を参照されたい。ここでは、詳細は再度説明しない。
任意選択で、この拡張実施形態では、ステップ104の前に、具体的には、方法は、以下をさらに含み得る。復号デバイスは、ビットストリームを復号して、帯域幅拡張周波数帯域の周波数エンベロープを取得し、それによって、ステップ104が実行できる。
あるいは、任意選択で、ステップ104の前に、具体的には、方法は、以下をさらに含み得る。復号デバイスは、ビットストリームを復号して信号タイプを取得し、信号タイプに従って帯域幅拡張周波数帯域の周波数エンベロープを獲得する。
たとえば、信号タイプが非高調波信号であるとき、復号デバイスは、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して帯域幅拡張周波数帯域の周波数エンベロープを取得する。信号タイプが高調波信号であるとき、復号デバイスは、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して帯域幅拡張周波数帯域の初期周波数エンベロープを取得し、初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープについて重み付け計算を実行することによって取得された値を帯域幅拡張周波数帯域の周波数エンベロープとして使用し、ここで、Nは1よりも大きいまたはこれに等しい。
前述の実施形態における帯域幅拡張周波数帯域信号を予測する方法を使用することによって、帯域幅拡張周波数帯域信号の、前のフレームと後のフレームとの間にある予測された励振信号の連続性が効果的に確保でき、それによって、復元される帯域幅拡張周波数帯域信号の聴覚品質を確保し、オーディオ信号の聴覚品質を向上させる。
図4は、本発明のもう1つの実施形態による、帯域幅拡張周波数帯域信号を予測する方法のフローチャートである。図3に示される実施形態に基づいて、この実施形態では、本発明の技術的解決策は、帯域幅拡張周波数帯域信号を予測する方法において、より詳細に紹介される。この実施形態では、帯域幅拡張周波数帯域信号を予測する方法は、具体的には、以下の内容を含み得る。
200。復号デバイスは、符号化デバイスによって送られたビットストリームを受信し、受信されたビットストリームを復号して周波数領域信号を取得する。
ビットストリームは、低周波数帯域信号の量子化パラメータおよび帯域幅拡張周波数帯域信号の周波数エンベロープを搬送する。
201。復号デバイスは、低周波数帯域信号の量子化パラメータに従って低周波数帯域信号の励振信号を獲得する。
202。復号デバイスは、低周波数帯域信号の量子化パラメータに従って、周波数領域信号の、ビットが割り当てられた最高周波数flast_sfmを決定する。
この実施形態では、flast_sfmは、周波数領域信号の、ビットが割り当てられた最高周波数ビンを表すために使用される。
203。復号デバイスは、flast_sfmが、周波数領域信号の帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startよりも小さいかどうか判定する。flast_sfmがfbwe_startよりも小さいとき、ステップ204を実行する。そうでない場合、flast_sfmがfbwe_startよりも大きいまたはこれに等しいとき、ステップ205を実行する。
図5aおよび図5bの周波数帯域内の周波数ビンの概略図を参照すると、ビットが割り当てられた周波数領域信号は、復号することによって直接取得され得る。しかしながら、帯域幅拡張周波数帯域は、復号された周波数領域信号に従った予測によって取得される必要があり、すなわち、周波数領域信号の所定の周波数帯域範囲内の励振信号は、帯域幅拡張周波数帯域の励振信号を予測するように選択される。flast_sfmとfbwe_startの間の大きさの関係が異なるとき、拡張の開始周波数および信号拡張範囲が異なる。図に示される影付きの部分は、帯域幅拡張周波数帯域の、励振信号が低周波数帯域からコピーされる必要がある周波数帯域範囲を表し、図5aの影付きの部分は、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンから帯域幅拡張周波数帯域の最高周波数ビンまでであり、図5bの影付きの部分は、ビットが割り当てられた最高周波数ビンから帯域幅拡張周波数帯域の最高周波数ビンまでである。図5aの場合、コピーされた励振信号は、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを含む。図5bの場合、コピーされた励振信号は、所定の周波数帯域範囲のfexc_start+から所定の周波数帯域範囲の終了周波数fexc_endまでの励振信号と、所定の周波数帯域範囲内の励振信号のn個のコピーを含み、ここで、nは0よりも大きい整数または非整数である。
この実施形態では、fbwe_startは、周波数領域信号の帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンを表すために使用される。fbwe_startの選択は、符号化レート(すなわち、ビットの総量)に関連する。高い符号化レートは、帯域幅拡張周波数帯域の、選択可能な、より高いあらかじめ設定された開始周波数fbwe_startを示す。たとえば、超広帯域信号について、符号化レートが24kbpsであるとき、周波数領域信号の帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startは6.4kHzに等しい。符号化レートが32kbpsであるとき、帯域幅拡張周波数帯域の、周波数領域信号のあらかじめ設定された開始周波数fbwe_startは8kHzに等しい。
204。復号デバイスは、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号および帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startに従って、帯域幅拡張周波数帯域の励振信号を予測し、ステップ206を実行する。
この実施形態では、周波数領域信号の所定の周波数帯域範囲は、fexc_startからfexc_endまでであり低周波数帯域信号内にある所定の周波数帯域範囲であり、fexc_startは、周波数領域信号の、低周波数帯域信号内にある帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンであり、fexc_endは、周波数領域信号の、低周波数帯域信号内にある帯域幅拡張周波数帯域のあらかじめ設定された終了周波数ビンであり、ここで、fexc_endはfexc_startよりも大きい。
たとえば、復号デバイスは、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の励振信号として使用し得る。ここで、nは0よりも大きい整数または非整数であり、nは、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の周波数ビンの数量の、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の周波数ビンの数量に対する比に等しい。
たとえば、具体的な実現では、予測が、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startから開始されるとき、復号デバイスは、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、この励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の帯域幅拡張周波数帯域信号として使用し得る。この実施形態では、nは正の整数または小数であり得るとともに、nは、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の周波数ビンの数量の、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の周波数ビンの数量に対する比に等しい。周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲の選択は、信号タイプおよび符号化レートに関連する。たとえば、比較的低いレートの場合、高調波信号については、低周波数帯域信号における比較的良い符号化を有する比較的低い周波数帯域信号が選択され、非高調波信号については、低周波数帯域信号における比較的劣った符号化を有する比較的高い周波数帯域信号が選択される。比較的高いレートの場合、高調波信号について、低周波数帯域信号における比較的高い周波数帯域が選択され得る。
帯域幅拡張周波数帯域の最高周波数ビンは、周波数帯域の、信号が出力される必要がある最高周波数、または指定された周波数を指す。たとえば、広帯域信号は7kHzまたは8kHzであってよく、超広帯域信号は14kHzまたは16kHz、または他のあらかじめ設定された特定の周波数であってもよい。
この実施形態では、予測が帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startから開始されるとき、復号デバイスは、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の帯域幅拡張周波数帯域信号として使用することは、具体的には、以下の形態で実現され得る。予測が帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startから開始されるとき、復号デバイスは、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーおよび周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の帯域幅拡張周波数帯域の励振信号として使用し、ここで、nの非整数部分は1よりも小さい。
この実施形態では、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーは順次に作製されてよく、すなわち、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーが作製されるまで、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号の1個のコピーが毎回作製される。または、ミラーコピー(または、折り返しコピー(fold copy)と呼ばれる)も作製され得る。すなわち、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーが作製されるとき、n個のコピーが完了するまで、前方コピー(すなわちfexc_startからfexc_endまで)と後方コピー(すなわちfexc_endからfexc_startまで)が交互に順次に作製される。
あるいは、予測が帯域幅拡張周波数帯域のあらかじめ設定された最高周波数ftop_sfmから開始されるとき、復号デバイスは、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の高周波数励振信号として使用し得る。これは、具体的には、以下の形態で実現され得る。予測が帯域幅拡張周波数帯域の最高周波数ftop_sfmから開始されるとき、復号デバイスは、fexc_startからfexc_endまでの周波数帯域範囲内の低周波数励振信号のn個のコピーにおける非整数コピーおよび周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の帯域幅拡張周波数帯域の励振信号として使用し、ここで、nの非整数部分は1よりも小さい。
具体的には、予測が帯域幅拡張周波数帯域の最高周波数ftop_sfmから開始されるとき、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーを作製することは、ブロック単位でコピーすることに属する。たとえば、帯域幅拡張周波数帯域の最高周波数ビンは14kHzであり、fexc_startからfexc_endまでは1.6kHzから4kHzまでである。fexc_startからfexc_endまでの低周波数励振信号の0.5個のコピー、すなわち1.6kHzから2.8kHzまでが作製されるとき、このステップの解決策を使用することによって、1.6kHzから2.8kHzまでの低周波数帯域内の励振信号は、(14-1.2)kHzと14kHzとの間の帯域幅拡張周波数帯域にコピーされ、この帯域幅拡張周波数帯域の励振信号として使用され得る。この場合、したがって、1.6kHzが(14-1.2)kHzにコピーされ、したがって、2.8kHzが14kHzにコピーされる。
前述の2つの形態では、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startから始まるまたは帯域幅拡張周波数帯域の最高周波数ftop_sfmから始まる、帯域幅拡張周波数帯域の開始周波数fbwe_startと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の帯域幅拡張周波数帯域の励振信号を予測するかどうかに関係なく、予測によって最終的に取得された、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の帯域幅拡張周波数帯域の励振信号の結果は同じである。
前述の解決策の実現プロセスでは、商および剰余がまず計算され、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startと周波数帯域信号の最高周波数ftop_sfmとの間の周波数帯域幅をfexc_startとfexc_endとの間の周波数帯域幅で除算することによって獲得され得る。ここでは、商はnの整数部分であり、剰余/(fexc_end-fexc_start)はnの非整数部分である。このようにして、nの整数部分およびnの非整数部分がまず計算され得る。次いで、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の帯域幅拡張周波数帯域の励振信号が前述の形態で予測される。
205。復号デバイスは、fexc_startからfexc_endまでの範囲内の励振信号、fbwe_start、およびflast_sfmに従って、帯域幅拡張周波数帯域の励振信号を予測し、ステップ206を実行する。
たとえば、復号デバイスは、周波数領域信号の所定の周波数帯域範囲の開始周波数ビンfexc_startより上のm番目の周波数ビンから周波数領域信号の所定の周波数帯域範囲の終了周波数ビンfexc_endまでの励振信号のコピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号の2つの部分を、周波数領域信号の、ビットが割り当てられた最高周波数flast_sfmと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の励振信号として使用し得る。ここで、nは0または0よりも大きい整数もしくは非整数であり、mはビットが割り当てられた最高周波数flast_sfmと拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startとの間の周波数ビンの数量の値である。
たとえば、予測が、ビットが割り当てられた最高周波数flast_sfmから開始されるとき、復号デバイスは、周波数領域信号の所定の周波数帯域範囲内の(fexc_start+(flast_sfm-fbwe_start))からfexc_endまでの励振信号のコピーおよびfexc_startからfexc_endまでの励振周波数帯域範囲内の励振信号のn個のコピーを順次作製し、励振信号の2つの部分を、ビットが割り当てられた最高周波数flast_sfmと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の帯域幅拡張周波数帯域の励振信号として使用し得る。ここで、nは0または0よりも大きい整数もしくは非整数である。
具体的な実現では、予測が、ビットが割り当てられた最高周波数flast_sfmから開始されるとき、復号デバイスは、周波数領域信号の所定の周波数帯域範囲内の(fexc_start+(flast_sfm-fbwe_start))からfexc_endまでの励振信号のコピー、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号、および周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数flast_sfmと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の帯域幅拡張周波数帯域の励振信号として使用し得る。ここで、nの非整数部分は1よりも小さい。
あるいは、予測が帯域幅拡張周波数帯域の最高周波数ftop_sfmから開始されるとき、復号デバイスは、周波数領域のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーおよび周波数領域信号の所定の周波数帯域範囲内の(fexc_start+(flast_sfm-fbwe_start))からfexc_endまでの励振信号のコピーを順次作製し、励振信号の2つの部分を、ビットが割り当てられた最高周波数flast_sfmと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の帯域幅拡張周波数帯域の励振信号として使用し得る。ここで、同様に、nは0または0よりも大きい整数もしくは非整数である。
具体的な実現では、予測が帯域幅拡張周波数帯域の最高周波数ftop_sfmから開始されるとき、復号デバイスは、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピー、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピー、および周波数領域信号の所定の周波数帯域範囲内の(fexc_start+(flast_sfm-fbwe_start))からfexc_endまでの励振信号のコピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数flast_sfmと帯域幅拡張周波数帯域の最高周波数ビンとの間の帯域幅拡張周波数帯域の励振信号として使用し得る。ここで、nの非整数部分は1よりも小さい。
復号デバイスが、帯域幅拡張周波数帯域の最高周波数ftop_sfmから始まる予測を実行するとき、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーを作製することも、ブロック単位でコピーすることに属する。周波数領域信号の所定の周波数帯域範囲内の低周波数に対応する励振信号は、帯域幅拡張周波数帯域内の対応する低周波数に配置され、周波数領域信号の所定の周波数帯域範囲内の高周波数に対応する励振信号は、帯域幅拡張周波数帯域内の対応する高周波数に配置される。詳細については、前述の関連する記載を参照されたい。同様に、周波数領域信号のfexc_startからfexc_endまでの所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーも、順次コピーまたはミラーコピーであり得る。詳細については、前述の関連する記載を参照されたい。ここでは、詳細は再度説明しない。
前述の2つの形態では、ビットが割り当てられた最高周波数flast_sfmから始まるまたは帯域幅拡張周波数帯域の最高周波数ftop_sfmから始まる、ビットが割り当てられた最高周波数flast_sfmと帯域幅拡張周波数帯域の最高周波数ビンとの間の帯域幅拡張周波数帯域の励振信号を予測するかどうかに関係なく、予測によって最終的に取得された、ビットが割り当てられた最高周波数flast_sfmと帯域幅拡張周波数帯域の最高周波数ビンとの間の帯域幅拡張周波数帯域の励振信号の結果は同じである。
さらに、前述の解決策では、(fexc_start+(flast_sfm-fbwe_start))からfexc_endまでの帯域幅が、ビットが割り当てられた最高周波数flast_sfmと帯域幅拡張周波数帯域の最高周波数ビンとの間の帯域幅よりも大きいまたはこれに等しいとき、(fexc_start+(flast_sfm-fbwe_start))からfexc_endまでの(fexc_start+(flast_sfm-fbwe_start))から始まる帯域幅において、低周波数帯域信号の、ビットが割り当てられた最高周波数flast_sfmと帯域幅拡張周波数帯域の最高周波数ビンとの間の帯域幅と同じ帯域幅を有する励振信号を獲得し、励振信号を、ビットが割り当てられた最高周波数flast_sfmと帯域幅拡張周波数帯域の最高周波数ビンとの間の帯域幅拡張周波数帯域の励振信号として使用する必要があるだけである。
前述の解決策の実現プロセスでは、商および剰余がまず計算され、(fexc_start+(flast_sfm-fbwe_start))と、ビットが割り当てられた最高周波数flast_sfmと周波数帯域信号の最高周波数ftop_sfmとの間の周波数帯域幅との差を、fexc_startとfexc_endとの間の周波数帯域幅で除算することによって獲得され得る。ここでは、商はnの整数部分であり、剰余/(fexc_end-fexc_start)はnの非整数部分である。このようにして、nの整数部分およびnの非整数部分がまず計算され得る。次いで、ビットが割り当てられた最高周波数flast_sfmと帯域幅拡張周波数帯域の最高周波数ftop_sfmとの間の帯域幅拡張周波数帯域の励振信号が前述の形態で予測される。
たとえば、符号化レートが24kbpsであるとき、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startは6.4kHzに等しく、ftop_sfmは14kHzである。帯域幅拡張周波数帯域の励振信号は、以下の形態で予測される。低周波数帯域信号のあらかじめ選択された拡張範囲が0kHz〜4kHzであり、N番目のフレームにおける、ビットが割り当てられた最高周波数flast_sfmは8kHzに等しいと仮定する。この場合、flast_sfmはfbwe_startよりも大きい。まず、自己適応型正規化処理が、低周波数帯域信号の、0kHz〜4kHzの周波数帯域範囲内にある選択された励振信号について実行され(自己適応型正規化処理の具体的なプロセスについては、前述の実施形態における記載を参照されたい。ここでは、詳細は再度説明しない)、次いで、低周波数帯域信号の正規化された励振信号から、8kHzよりも大きい帯域幅拡張周波数帯域の励振信号が予測される。前述の実施形態における形態によれば、低周波数帯域信号の選択された正規化された励振信号をコピーするための順序は次の通りである。まず、周波数領域信号の所定の周波数帯域範囲内の(8kHz-6.4kHz)から4kHzまでの励振信号がコピーされ、次いで、周波数領域信号のfexc_startからfexc_endまで(0kHz〜4kHz)の所定の周波数帯域範囲内の励振信号の0.9個のコピーが作製され、すなわち、周波数領域信号の所定の周波数帯域範囲内の0kHzから3.6kHzまでの励振信号がコピーされ、励振信号の2つの部分が、ビットが割り当てられた最高周波数(flast_sfm=8kHz)と帯域幅拡張周波数帯域の最高周波数ftop_sfm(ftop_sfm=14kHz)との間の帯域幅拡張周波数帯域の励振信号として使用される。(N+1)番目のフレームにおける、ビットが割り当てられた最高周波数flast_sfmが6.4kHzよりも小さいまたはこれに等しい(帯域幅拡張周波数帯域のあらかじめ設定された開始周波数fbwe_startが6.4kHzに等しい)ならば、自己適応型正規化処理が、低周波数帯域信号の、0kHz〜4kHzの周波数帯域範囲内である選択された励振信号について実行され、次いで、6.4kHzよりも大きい帯域幅拡張周波数帯域の励振信号が、低周波数帯域信号の正規化された励振信号から予測される。前述の実施形態における形態によれば、低周波数帯域信号の選択された正規化された励振信号をコピーするための順序は次の通りである。まず、周波数領域信号のfexc_startからfexc_endまで(0kHz〜4kHz)の所定の周波数帯域範囲内の励振信号の1つのコピーが作製され、次いで、周波数領域信号のfexc_startからfexc_endまで(0kHz〜4kHz)の所定の周波数帯域範囲内の励振信号の0.9個のコピーが作製され、励振信号の2つの部分が、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数(fbwe_start=6.4kHz)と帯域幅拡張周波数帯域の最高周波数ftop_sfm(ftop_sfm=14kHz)との間の帯域幅拡張周波数帯域の励振信号として使用される。
帯域幅拡張周波数帯域の最高周波数ビンは、周波数領域信号のタイプに従って決定される。たとえば、周波数領域信号のタイプが超広帯域信号であるとき、帯域幅拡張周波数帯域の最高周波数ftop_sfmは14kHzである。互いと通信する前に、一般に、符号化デバイスおよび復号デバイスは、送信されるべき周波数領域信号のタイプを決定している。したがって、周波数領域信号の最高周波数ビンは決定されていると考え得る。
206。復号デバイスは、帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って、帯域幅拡張周波数帯域信号を予測する。
帯域幅拡張周波数帯域信号の励振信号の前述の予測から、N番目のフレームと(N+1)番目のフレームにおける帯域幅拡張の開始周波数ビンは異なるが、8kHzよりも大きい同じ周波数帯域の励振信号が、低周波数帯域信号の同じ周波数帯域の励振信号から予測されることがわかり得る。したがって、フレーム間の連続性が確保できる。次いで、ステップ206が使用され、それによって、帯域幅拡張周波数帯域の正確な予測を実現する。
前述の実施形態の技術的解決策を使用することによって、帯域幅拡張周波数帯域信号の、前のフレームと後のフレームとの間にある予測された励振信号の連続性が効果的に確保でき、それによって、復元される帯域幅拡張周波数帯域信号の聴覚品質を確保し、オーディオ信号の聴覚品質を向上させる。
前述の方法の実施形態のステップの全てまたは一部は、関連するハードウェアに命令するプログラムによって実現され得ることを、この技術分野の当業者は理解し得る。プログラムは、コンピュータ可読記憶媒体に保存され得る。プログラムが実行されるとき、前述の方法の実施形態のステップが実行される。前述の記憶媒体は、ROM、RAM、磁気ディスク、または光ディスクのような、プログラムコードを保存できる任意の媒体を含む。
図6は、本発明の一実施形態による復号デバイスの概略構造図である。図6に示されるように、この実施形態における復号デバイスは、復号モジュール30と、判定モジュール31と、第1の処理モジュール32と、第2の処理モジュール33と、予測モジュール34とを含む。
復号モジュール30は、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して周波数領域信号を取得するように構成される。判定モジュール31は復号モジュール30に接続され、判定モジュール31は、復号モジュール30による復号によって取得された周波数領域信号の、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいかどうか判定するように構成される。第1の処理モジュール32は判定モジュール31に接続され、第1の処理モジュール32は、判定モジュール31が、ビットが割り当てられた最高周波数ビンは帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいと判定したとき、周波数領域信号の所定の周波数帯域範囲内の励振信号および帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測するように構成される。第2の処理モジュール33も判定モジュール31に接続され、第2の処理モジュール33は、判定モジュール31が、ビットが割り当てられた最高周波数ビンは帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも大きいまたはこれに等しいと判定したとき、周波数領域信号の所定の周波数帯域範囲内の励振信号、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン、およびビットが割り当てられた最高周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測するように構成される。予測モジュール34は、第1の処理モジュール32または第2の処理モジュール33に接続される。判定モジュール31が、ビットが割り当てられた最高周波数ビンは帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいと判定したとき、予測モジュール34は第1の処理モジュール32に接続される。判定モジュール31が、ビットが割り当てられた最高周波数ビンは帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも大きいまたはこれに等しいと判定したとき、予測モジュール34は第2の処理モジュール33に接続される。予測モジュール34は、帯域幅拡張周波数帯域の、第1の処理モジュール32または第2の処理モジュール33によって予測される励振信号、および帯域幅拡張周波数帯域の周波数エンベロープに従って、帯域幅拡張周
波数帯域信号を予測するように構成される。
この実施形態における復号デバイスにより、前述のモジュールを使用して帯域幅拡張周波数帯域信号の予測を実現する実現プロセスは、前述の関連する方法の実施形態における実現プロセスと同じである。詳細については、前述の関連する方法の実施形態の記載を参照されたい。ここでは、詳細は再度説明しない。
この実施形態における復号デバイスにより、前述のモジュールを使用することによって、帯域幅拡張の開始周波数ビンが設定され、周波数領域信号が復号された最高周波数ビンと開始周波数ビンが比較され、帯域幅拡張周波数帯域の励振復元を実行し、それによって、拡張された励振信号はフレーム間で連続しており、復号された励振信号の周波数ビンは維持され、それによって、復元された帯域幅拡張周波数帯域信号の聴覚品質を確保し、出力オーディオ信号の聴覚品質を向上させる。
図7は、本発明のもう1つの実施形態による復号デバイスの概略構造図である。図7に示されるように、図6に示される前述の実施形態に基づいて、この実施形態における復号デバイスにより、本発明の技術的解決策が、より詳細にさらに紹介される。
図7に示されるように、第1の処理モジュール32は、具体的には、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、ここで、nは0よりも大きい整数または非整数であり、nは、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の周波数ビンの数量の、周波数領域信号の所定の周波数帯域範囲内の周波数ビンの数量に対する比に等しい。
さらに任意選択で、この実施形態では、復号デバイス内の第1の処理モジュール32は、具体的には、予測が、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンから開始されるとき、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、ここで、nの非整数部分は1よりも小さい、または、第1の処理モジュール32は、具体的には、予測が、帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーを順次作製し、励振信号の2つの部分を、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、ここで、nの非整数部分は1よりも小さい。
任意選択で、この実施形態では、復号デバイス内の第2の処理モジュール33は、具体的には、周波数領域信号の所定の周波数帯域範囲の開始周波数ビンfexc_startより上のm番目の周波数ビンから周波数領域信号の所定の周波数帯域範囲の終了周波数ビンfexc_endまでの励振信号のコピーおよび周波数領域信号の所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号の2つの部分を、周波数領域信号の、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、ここで、nは0または0よりも大きい整数もしくは非整数であり、mはビットが割り当てられた最高周波数ビンと拡張周波数帯域のあらかじめ設定された開始周波数ビンとの間の周波数ビンの数量の値である。
さらに任意選択で、この実施形態では、復号デバイス内の第2の処理モジュール33は、具体的には、予測が、ビットが割り当てられた最高周波数ビンから開始されるとき、周波数領域信号の、fexc_start+(ビットが割り当てられた最高周波数ビン〜帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン)からfexc_endまでの周波数帯域範囲内の励振信号のコピー、周波数領域信号のfexc_startからfexc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける整数コピー、および周波数領域信号のfexc_startからfexc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、ここで、nの非整数部分は1よりも小さい、または第2の処理モジュール33は、具体的には、予測が、帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、周波数領域信号のfexc_startからfexc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピー、周波数領域信号のfexc_startからfexc_endまでの周波数帯域範囲内の励振信号のn個のコピーにおける整数コピー、および周波数領域信号のfexc_start+(ビットが割り当てられた最高周波数ビン〜帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン)からfexc_endまでの周波数帯域範囲内の励振信号のコピーを順次作製し、励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと帯域幅拡張周波数帯域の最高周波数ビンとの間の高周波数励振信号として使用するように構成され、ここで、nの非整数部分は1よりも小さい。
任意選択で、この実施形態では、復号モジュール30は、予測モジュール34が帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って帯域幅拡張周波数帯域信号を予測する前に、ビットストリームを復号して帯域幅拡張周波数帯域の周波数エンベロープを取得するようにさらに構成される。この場合、対応する予測モジュール34は復号モジュール30にさらに接続され、予測モジュール34は、帯域幅拡張周波数帯域の、第1の処理モジュール32または第2の処理モジュール33によって予測された励振信号、および帯域幅拡張周波数帯域の、復号モジュール30による復号によって取得された周波数エンベロープに従って、帯域幅拡張周波数帯域信号を予測するように構成される。
さらに任意選択で、この実施形態では、復号デバイスは獲得モジュール35をさらに含む。
復号モジュール30は、予測モジュール34が帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って帯域幅拡張周波数帯域信号を予測する前に、ビットストリームを復号して信号タイプを取得するようにさらに構成される。獲得モジュール35は復号モジュール30に接続され、獲得モジュール35は、復号モジュール30による復号によって取得された信号タイプに従って、帯域幅拡張周波数帯域の周波数エンベロープを獲得するように構成される。この場合、対応する予測モジュール34は獲得モジュール35に接続され、予測モジュール34は、帯域幅拡張周波数帯域の、第1の処理モジュール32または第2の処理モジュール33によって予測された励振信号、および帯域幅拡張周波数帯域の、獲得モジュール35によって取得された周波数エンベロープに従って、帯域幅拡張周波数帯域信号を予測するように構成される。
さらに任意選択で、獲得モジュール35は、具体的には、復号モジュール30による復号によって取得された信号タイプが非高調波信号であるとき、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して帯域幅拡張周波数帯域の周波数エンベロープを取得するように構成される、または、獲得モジュール35は、具体的には、復号モジュール30による復号によって取得された信号タイプが高調波信号であるとき、受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して帯域幅拡張周波数帯域の初期周波数エンベロープを取得し、初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープについて重み付け計算を実行することによって取得された値を帯域幅拡張周波数帯域の周波数エンベロープとして使用するように構成され、ここで、Nは1よりも大きいまたはこれに等しい。
前述の実施形態における復号デバイスにより、本発明は、前述の任意選択の技術的解決策の全てを例として使用することによって紹介される。実際の適用では、前述の任意選択の技術的解決策の全ては、ランダムな組み合わせの形態で本発明の任意選択の実施形態を形成するようにランダムに組み合わされ得る。ここでは、詳細は再度説明しない。
前述の実施形態における復号デバイスにより、前述のモジュールを使用して帯域幅拡張周波数帯域信号の予測を実現する実現プロセスは、前述の関連する方法の実施形態における実現プロセスと同じである。詳細については、前述の関連する方法の実施形態の記載を参照されたい。ここでは、詳細は再度説明しない。
前述の実施形態における復号デバイスにより、前述のモジュールを使用することによって、帯域幅拡張の開始周波数ビンが設定され、周波数領域信号が復号された最高周波数ビンと開始周波数ビンが比較されて帯域幅拡張周波数帯域の励振復元を実行し、それによって、拡張された励振信号はフレーム間で連続しており、復号された励振信号の周波数ビンは維持され、それによって、復元された帯域幅拡張周波数帯域信号の聴覚品質を確保し、出力オーディオ信号の聴覚品質を向上させる。
図2に示される復号デバイスの機能は、前述の機能モジュールに従って調整されて本発明のこの実施形態における復号デバイスの例示の図を取得し得る。ここでは、詳細は再度説明しない。
本発明のこの実施形態における復号デバイスは、図1に示される符号化デバイスとともに使用されて帯域幅拡張周波数帯域信号を予測するシステムを形成し得る。ここでは、詳細は再度説明しない。
図8は、本発明のもう1つの実施形態による復号デバイス80のブロック図である。図8における復号デバイス80は、前述の方法の実施形態におけるステップおよび方法を実現するように構成され得る。復号デバイス80は、さまざまな通信システムにおいて基地局または端末に適用され得る。図8のこの実施形態では、復号デバイス80は、受信回路802と、復号プロセッサ803と、処理ユニット804と、メモリ805と、アンテナ801とを含む。処理ユニット804は復号デバイス80の動作を制御し、処理ユニット804は、CPU(Central Processing Unit、中央処理ユニット)とも呼ばれ得る。メモリ805は、リードオンリメモリおよびランダムアクセスメモリを含み得るとともに、処理ユニット804に命令およびデータを提供する。メモリ805の一部は、不揮発性ランダムアクセスメモリ(NVRAM)をさらに含み得る。具体的な適用では、携帯電話のようなワイヤレス通信デバイスは復号デバイス80に内蔵されてもよいし、復号デバイスそれ自体がワイヤレス通信デバイスであってもよく、復号デバイス80は、復号デバイス80が遠隔地からデータを受信することを可能にするように、受信回路802を収容する担体をさらに含んでよい。受信回路802は、アンテナ801に結合され得る。復号デバイス80の構成要素はバスシステム806を使用することによって、互いに結合され、ここで、バスシステム806は、データバスに加えて、電力バス、制御バス、および状態信号バスをさらに含む。しかしながら、説明の明確性のために、さまざまなバスが図8におけるバスシステム806として示される。復号デバイス80は、信号を処理するように構成された処理ユニット804をさらに含み、加えて、復号プロセッサ803をさらに含み得る。
本発明の前述の実施形態に開示されている方法は、復号プロセッサ803に適用されてもよいし、復号プロセッサ803によって実現されてもよい。復号プロセッサ803は集積回路チップであってよく、信号処理能力を有する。実現プロセスでは、前述の方法の実施形態におけるステップは、復号プロセッサ803内のハードウェアの集積論理回路を使用することによって、またはソフトウェアの形式では命令を使用することによって、達成され得る。これらの命令は、処理ユニット804と協働することによって実現および制御され得る。前述の復号プロセッサは、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)もしくは他のプログラム可能論理構成要素、個別ゲートもしくはトランジスタ論理構成要素、または個別ハードウェア構成要素であり得る。本発明の実施形態に開示されている方法、ステップ、および論理ブロック図は、実現または実行され得る。汎用プロセッサはマイクロプロセッサであってもよいし、プロセッサは任意の従来のプロセッサ、トランスレータなどであってもよい。本発明の実施形態を参照して開示される方法のステップは、ハードウェアとして実現された復号プロセッサによって直接実行および達成されてもよいし、復号プロセッサにおいてハードウェアおよびソフトウェアモジュールの組み合わせを使用することによって実行および達成されてもよい。ソフトウェアモジュールは、ランダムアクセスメモリ、フラッシュメモリ、リードオンリメモリ、プログラマブルリードオンリメモリ、電気的消去可能プログラマブルメモリ、またはレジスタのような、この技術分野で成熟した記憶媒体内に配置され得る。記憶媒体は、メモリ805内に配置される。復号プロセッサ803はメモリ805から情報を読み出し、ハードウェアと組み合わせて前述の方法のステップを達成する。
たとえば、図6または図7における信号復号デバイスは、復号プロセッサ803によって実現されてよい。さらに、図6における復号モジュール30、判定モジュール31、第1の処理モジュール32、第2の処理モジュール33、および予測モジュール34は、処理ユニット804によって実現されてもよいし、復号プロセッサ803によって実現されてもよい。同様に、図7における各モジュールは、処理ユニット804によって実現されてもよいし、復号プロセッサ803によって実現されてもよい。しかしながら、前述の例は例示にすぎず、本発明の実施形態をこの具体的な実現形態に限定することを意図するものではない。
具体的には、メモリ805は、処理ユニット804または復号プロセッサ803が以下の動作を実現することを可能にするために、命令を記憶する。受信されたビットストリームを逆多重化し、逆多重化されたビットストリームを復号して周波数領域信号を取得すること、周波数領域信号の、ビットが割り当てられた最高周波数ビンが、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいかどうか判定すること、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいとき、周波数領域信号の所定の周波数帯域範囲内の励振信号および帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測すること、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも大きいまたはこれに等しいとき、周波数領域信号の所定の周波数帯域範囲内の励振信号、帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビン、およびビットが割り当てられた最高周波数ビンに従って、帯域幅拡張周波数帯域の励振信号を予測すること、および帯域幅拡張周波数帯域の予測された励振信号および帯域幅拡張周波数帯域の周波数エンベロープに従って、帯域幅拡張周波数帯域信号を予測すること。
説明された装置の実施形態は例示にすぎない。別個の部分として説明されたユニットは物理的に別個であってもなくてもよく、ユニットとして表示された部分は物理的ユニットであってもなくてもよく、1つの位置にあってもよいし、少なくとも2つのネットワークユニット上に分散されてもよい。モジュールのうちのいくつかまたは全ては、実施形態の解決策の目的を達成するために、実際の必要性に従って選択されてよい。この技術分野の当業者は、創作的な労力なしで本発明の実施形態を理解および実現し得る。
最後に、前述の実施形態は本発明の技術的解決策を説明するために意図されたにすぎず、本発明を限定するためのものではないことに留意されたい。本発明は、前述の実施形態を参照して詳細に説明されているが、この技術分野の当業者は、依然として、本発明の実施形態の技術的解決策の思想および範囲から逸脱することなく、前述の実施形態において説明された技術的解決策に修正を加えてもよいし、そのいくつかの技術的特徴に対する等価な置き換えを行ってもよいことを理解するべきである。
30 復号モジュール
31 判定モジュール
32 第1の処理モジュール
33 第2の処理モジュール
34 予測モジュール
35 獲得モジュール
80 復号デバイス
801 アンテナ
802 受信回路
803 復号プロセッサ
804 処理ユニット
805 メモリ
806 バスシステム

Claims (17)

  1. 帯域幅拡張周波数帯域信号を予測する方法であって、
    受信されたビットストリームを逆多重化し、前記逆多重化されたビットストリームを復号して周波数領域信号を取得するステップと、
    前記周波数領域信号の、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいかどうか判定するステップと、
    ビットが割り当てられた最高周波数ビンが前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンよりも小さいとき、前記周波数領域信号の所定の周波数帯域範囲内の励振信号および前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンに従って、前記帯域幅拡張周波数帯域の励振信号を予測するステップと、
    ビットが割り当てられた最高周波数ビンが前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンよりも大きいまたはこれに等しいとき、前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビン、およびビットが割り当てられた最高周波数ビンに従って、前記帯域幅拡張周波数帯域の励振信号を予測するステップと、
    前記帯域幅拡張周波数帯域の予測された励振信号および前記帯域幅拡張周波数帯域の周波数エンベロープに従って、前記帯域幅拡張周波数帯域信号を予測するステップと
    を含む方法。
  2. 前記周波数領域信号の所定の周波数帯域範囲内の励振信号および前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンに従って前記帯域幅拡張周波数帯域の励振信号を予測する前記ステップは、
    前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、前記励振信号のn個のコピーを前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nは0よりも大きい整数または非整数であり、nは、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の周波数ビンの数量の、前記周波数領域信号の前記所定の周波数帯域範囲内の周波数ビンの数量に対する比に等しい、ステップ
    を含む、請求項1に記載の方法。
  3. 前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、前記励振信号のn個のコピーを前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用する前記ステップは、
    前記予測が、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンから開始されるとき、前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーおよび前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、前記励振信号の2つの部分を、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nの非整数部分は1よりも小さい、ステップ、または
    前記予測が、前記帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーおよび前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーを順次作製し、前記励振信号の2つの部分を、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nの非整数部分は1よりも小さい、ステップ
    を含む、請求項2に記載の方法。
  4. 前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビン、およびビットが割り当てられた最高周波数ビンに従って前記帯域幅拡張周波数帯域の励振信号を予測する前記ステップは、
    前記周波数領域信号の前記所定の周波数帯域範囲の開始周波数ビンfexc_startより上のm番目の周波数ビンfexc_start+から前記周波数領域信号の前記所定の周波数帯域範囲の終了周波数ビンfexc_endまでの励振信号のコピーおよび前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、前記励振信号の2つの部分を、前記周波数領域信号の、ビットが割り当てられた最高周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nは0または0よりも大きい整数もしくは非整数であり、mは正の整数であり、mはビットが割り当てられた最高周波数ビンと前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンとの間の周波数ビンの数量の値に等しい、ステップ
    を含む、請求項1から3のいずれか一項に記載の方法。
  5. 前記周波数領域信号の前記所定の周波数帯域範囲の開始周波数ビンfexc_startより上のm番目の周波数ビンfexc_start+から前記周波数領域信号の前記所定の周波数帯域範囲の終了周波数ビンfexc_endまでの励振信号のコピーおよび前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、前記励振信号の2つの部分を、前記周波数領域信号の、ビットが割り当てられた最高周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用する前記ステップは、
    前記予測が、ビットが割り当てられた最高周波数ビンから開始されるとき、低周波数帯域信号の、fexc_start+からfexc_endまでの励振信号のコピー、前記低周波数帯域信号の、fexc_startからfexc_endまでの励振信号のn個のコピーにおける整数コピー、および前記低周波数帯域信号の、fexc_startからfexc_endまでの励振信号のn個のコピーにおける非整数コピーを順次作製し、前記励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するステップであって、nの非整数部分は1よりも小さい、ステップ、または
    前記予測が、前記帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、低周波数帯域信号の、fexc_startからfexc_endまでの励振信号のn個のコピーにおける非整数コピー、前記低周波数帯域信号の、fexc_startからfexc_endまでの励振信号のn個のコピーにおける整数コピー、および前記低周波数帯域信号の、fexc_start+からfexc_endまでの励振信号のコピーを順次作製し、前記励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の高周波数励振信号として使用するステップであって、nの非整数部分は1よりも小さい、ステップ
    を含む、請求項4に記載の方法。
  6. 前記帯域幅拡張周波数帯域の前記予測された励振信号および前記帯域幅拡張周波数帯域の周波数エンベロープに従って前記帯域幅拡張周波数帯域信号を予測する前記ステップの前に、前記方法は、
    前記ビットストリームを復号して信号タイプを取得するステップと、
    前記信号タイプに従って前記帯域幅拡張周波数帯域の周波数エンベロープを獲得するステップと
    をさらに含む、請求項1から5のいずれか一項に記載の方法。
  7. 前記信号タイプに従って前記帯域幅拡張周波数帯域の周波数エンベロープを獲得する前記ステップは、
    前記信号タイプが非高調波信号であるとき、前記受信されたビットストリームを逆多重化し、前記逆多重化されたビットストリームを復号して前記帯域幅拡張周波数帯域の周波数エンベロープを取得するステップ、または
    前記信号タイプが高調波信号であるとき、前記受信されたビットストリームを逆多重化し、前記逆多重化されたビットストリームを復号して前記帯域幅拡張周波数帯域の初期周波数エンベロープを取得し、前記初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープについて重み付け計算を実行することによって取得された値を前記帯域幅拡張周波数帯域の周波数エンベロープとして使用するステップであって、Nは1よりも大きいまたはこれに等しい、ステップ
    を含む、請求項6に記載の方法。
  8. 前記帯域幅拡張周波数帯域の予測された励振信号および前記帯域幅拡張周波数帯域の周波数エンベロープに従って前記帯域幅拡張周波数帯域信号を予測する前記ステップの前に、前記方法は、
    前記ビットストリームを復号して前記帯域幅拡張周波数帯域の周波数エンベロープを取得するステップ
    をさらに含む、請求項1から5のいずれか一項に記載の方法。
  9. 受信されたビットストリームを逆多重化し、前記逆多重化されたビットストリームを復号して周波数領域信号を取得するように構成された復号モジュールと、
    前記周波数領域信号の、ビットが割り当てられた最高周波数ビンが帯域幅拡張周波数帯域のあらかじめ設定された開始周波数ビンよりも小さいかどうか判定するように構成された判定モジュールと、
    前記判定モジュールが、ビットが割り当てられた最高周波数ビンは前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンよりも小さいと判定したとき、前記周波数領域信号の所定の周波数帯域範囲内の励振信号および前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンに従って、前記帯域幅拡張周波数帯域の励振信号を予測するように構成された第1の処理モジュールと、
    前記判定モジュールが、ビットが割り当てられた最高周波数ビンは前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンよりも大きいまたはこれに等しいと判定したとき、前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビン、およびビットが割り当てられた最高周波数ビンに従って、前記帯域幅拡張周波数帯域の励振信号を予測するように構成された第2の処理モジュールと、
    前記帯域幅拡張周波数帯域の予測された励振信号および前記帯域幅拡張周波数帯域の周波数エンベロープに従って帯域幅拡張周波数帯域信号を予測するように構成された予測モジュールと
    を備える復号デバイス。
  10. 前記第1の処理モジュールは、具体的には、前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、前記励振信号のn個のコピーを前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nは0よりも大きい整数または非整数であり、nは、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の周波数ビンの数量の、前記周波数領域信号の前記所定の周波数帯域範囲内の周波数ビンの数量に対する比に等しい、請求項9に記載のデバイス。
  11. 前記第1の処理モジュールは、具体的には、前記予測が、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンから開始されるとき、前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーおよび前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーを順次作製し、前記励振信号の2つの部分を、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nの非整数部分は1よりも小さい、または
    前記第1の処理モジュールは、具体的には、前記予測が、前記帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける非整数コピーおよび前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーにおける整数コピーを順次作製し、前記励振信号の2つの部分を、前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nの非整数部分は1よりも小さい、請求項10に記載のデバイス。
  12. 前記第2の処理モジュールは、具体的には、前記周波数領域信号の前記所定の周波数帯域範囲の開始周波数ビンfexc_startより上のm番目の周波数ビンfexc_start+から前記周波数領域信号の前記所定の周波数帯域範囲の終了周波数ビンfexc_endまでの励振信号のコピーおよび前記周波数領域信号の前記所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、前記励振信号の2つの部分を、前記周波数領域信号の、ビットが割り当てられた最高周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nは0または0よりも大きい整数もしくは非整数であり、mは正の整数であり、mはビットが割り当てられた最高周波数ビンと前記帯域幅拡張周波数帯域の前記あらかじめ設定された開始周波数ビンとの間の周波数ビンの数量の値に等しい、請求項9から11のいずれか一項に記載のデバイス。
  13. 前記第2の処理モジュールは、具体的には、前記予測が、ビットが割り当てられた最高周波数ビンから開始されるとき、fexc_start+からfexc_endまでの励振信号のコピー、fexc_startからfexc_endまでの励振信号のn個のコピーにおける整数コピー、およびfexc_startからfexc_endまでの励振信号のn個のコピーにおける非整数コピーを順次作製し、前記励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の励振信号として使用するように構成され、nの非整数部分は1よりも小さい、または
    第2の処理モジュールは、具体的には、前記予測が、前記帯域幅拡張周波数帯域の最高周波数ビンから開始されるとき、fexc_startからfexc_endまでの励振信号のn個のコピーにおける非整数コピー、fexc_startからfexc_endまでの励振信号のn個のコピーにおける整数コピー、およびfexc_start+からfexc_endまでの励振信号のコピーを順次作製し、前記励振信号の3つの部分を、ビットが割り当てられた最高周波数ビンと前記帯域幅拡張周波数帯域の最高周波数ビンとの間の高周波数励振信号として使用するように構成され、nの非整数部分は1よりも小さい、請求項12に記載のデバイス。
  14. 前記復号モジュールは、前記予測モジュールが前記帯域幅拡張周波数帯域の予測された励振信号および前記帯域幅拡張周波数帯域の周波数エンベロープに従って前記帯域幅拡張周波数帯域信号を予測する前に、前記ビットストリームを復号して前記帯域幅拡張周波数帯域の周波数エンベロープを取得するようにさらに構成された、請求項9から13のいずれか一項に記載のデバイス。
  15. 獲得モジュールをさらに備え、
    前記復号モジュールは、前記予測モジュールが前記帯域幅拡張周波数帯域の予測された励振信号および前記帯域幅拡張周波数帯域の周波数エンベロープに従って前記帯域幅拡張周波数帯域信号を予測する前に、前記ビットストリームを復号して信号タイプを取得するようにさらに構成され、
    前記獲得モジュールは、前記信号タイプに従って前記帯域幅拡張周波数帯域の周波数エンベロープを獲得するように構成された、請求項9から14のいずれか一項に記載のデバイス。
  16. 前記獲得モジュールは、具体的には、前記信号タイプが非高調波信号であるとき、前記受信されたビットストリームを逆多重化し、前記逆多重化されたビットストリームを復号して前記帯域幅拡張周波数帯域の周波数エンベロープを取得するように構成され、または
    前記獲得モジュールは、具体的には、前記信号タイプが高調波信号であるとき、前記受信されたビットストリームを逆多重化し、前記逆多重化されたビットストリームを復号して前記帯域幅拡張周波数帯域の初期周波数エンベロープを取得し、前記初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープについて重み付け計算を実行することによって取得された値を前記帯域幅拡張周波数帯域の周波数エンベロープとして使用するように構成され、Nは1よりも大きいまたはこれに等しい、請求項15に記載のデバイス。
  17. 請求項1から8のいずれか一項に記載の方法をコンピュータに実行させるプログラムが記録されたコンピュータ可読記憶媒体。
JP2015554015A 2013-01-29 2013-07-23 帯域幅拡張周波数帯域信号を予測する方法、および復号デバイス Active JP6202545B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310034240.9A CN103971694B (zh) 2013-01-29 2013-01-29 带宽扩展频带信号的预测方法、解码设备
CN201310034240.9 2013-01-29
PCT/CN2013/079883 WO2014117484A1 (zh) 2013-01-29 2013-07-23 带宽扩展频带信号的预测方法、解码设备

Publications (2)

Publication Number Publication Date
JP2016507781A JP2016507781A (ja) 2016-03-10
JP6202545B2 true JP6202545B2 (ja) 2017-09-27

Family

ID=51241110

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015554015A Active JP6202545B2 (ja) 2013-01-29 2013-07-23 帯域幅拡張周波数帯域信号を予測する方法、および復号デバイス

Country Status (7)

Country Link
US (4) US9361904B2 (ja)
EP (3) EP2940685B8 (ja)
JP (1) JP6202545B2 (ja)
KR (1) KR101602264B1 (ja)
CN (1) CN103971694B (ja)
ES (1) ES2813956T3 (ja)
WO (1) WO2014117484A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106847297B (zh) 2013-01-29 2020-07-07 华为技术有限公司 高频带信号的预测方法、编/解码设备
EP3091536B1 (en) * 2014-01-15 2019-12-11 Samsung Electronics Co., Ltd. Weight function determination for a quantizing linear prediction coding coefficient
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
ES2867874T3 (es) * 2016-10-11 2021-10-21 Genomsys Sa Procedimiento y sistema para la transmisión de datos bioinformáticos
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
CN107886966A (zh) * 2017-10-30 2018-04-06 捷开通讯(深圳)有限公司 终端及其优化语音命令的方法、存储装置
WO2020258227A1 (zh) * 2019-06-28 2020-12-30 瑞声声学科技(深圳)有限公司 致动器激励信号处理方法、装置、计算机设备及存储介质
CN113963703A (zh) * 2020-07-03 2022-01-21 华为技术有限公司 一种音频编码的方法和编解码设备
CN115552518A (zh) * 2021-11-02 2022-12-30 北京小米移动软件有限公司 一种信号编解码方法、装置、用户设备、网络侧设备及存储介质
WO2024050673A1 (zh) * 2022-09-05 2024-03-14 北京小米移动软件有限公司 一种音频信号频带扩展方法、装置、设备及存储介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3751225B2 (ja) * 2001-06-14 2006-03-01 松下電器産業株式会社 オーディオ帯域拡張装置
JP2003044098A (ja) 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
BRPI0520729B1 (pt) * 2005-11-04 2019-04-02 Nokia Technologies Oy Método para a codificação e decodificação de sinais de áudio, codificador para codificação e decodificador para decodificar sinais de áudio e sistema para compressão de áudio digital.
CN101140759B (zh) 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101375582B1 (ko) * 2006-11-17 2014-03-20 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
CN101939782B (zh) 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
JP4529092B2 (ja) * 2007-09-25 2010-08-25 ソニー株式会社 チューナ装置
KR100970446B1 (ko) 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
EP2224432B1 (en) 2007-12-21 2017-03-15 Panasonic Intellectual Property Corporation of America Encoder, decoder, and encoding method
PL2311033T3 (pl) * 2008-07-11 2012-05-31 Fraunhofer Ges Forschung Dostarczanie sygnału aktywującego dopasowanie czasowe i kodowanie sygnału audio z jego użyciem
JP4818335B2 (ja) * 2008-08-29 2011-11-16 株式会社東芝 信号帯域拡張装置
CN101751926B (zh) 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
PT2359366T (pt) * 2008-12-15 2017-01-20 Fraunhofer Ges Forschung Codificador de áudio e descodificador de extensão de largura de banda
CN101853664B (zh) * 2009-03-31 2011-11-02 华为技术有限公司 一种信号去噪的方法和装置及音频解码系统
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US20130346073A1 (en) * 2011-01-12 2013-12-26 Nokia Corporation Audio encoder/decoder apparatus
CN102610231B (zh) * 2011-01-24 2013-10-09 华为技术有限公司 一种带宽扩展方法及装置

Also Published As

Publication number Publication date
KR20150109460A (ko) 2015-10-01
ES2813956T3 (es) 2021-03-25
US10388295B2 (en) 2019-08-20
US9361904B2 (en) 2016-06-07
EP2940685A1 (en) 2015-11-04
JP2016507781A (ja) 2016-03-10
US20180122393A1 (en) 2018-05-03
EP2940685A4 (en) 2016-08-10
US10607621B2 (en) 2020-03-31
EP2940685B8 (en) 2020-08-19
EP3764354A1 (en) 2021-01-13
EP3958258A1 (en) 2022-02-23
US9875749B2 (en) 2018-01-23
KR101602264B1 (ko) 2016-03-10
WO2014117484A1 (zh) 2014-08-07
CN103971694A (zh) 2014-08-06
US20160247513A1 (en) 2016-08-25
US20190325884A1 (en) 2019-10-24
CN103971694B (zh) 2016-12-28
EP2940685B1 (en) 2020-06-24
US20150332688A1 (en) 2015-11-19

Similar Documents

Publication Publication Date Title
JP6202545B2 (ja) 帯域幅拡張周波数帯域信号を予測する方法、および復号デバイス
JP6574820B2 (ja) 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス
JP6364518B2 (ja) オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置
KR101736705B1 (ko) 오디오 신호를 위한 비트 할당 방법 및 장치
RU2702265C1 (ru) Способ и устройство обработки сигналов
JP2014507681A (ja) 帯域幅を拡張する方法および装置
JP6264673B2 (ja) ロストフレームを処理するための方法および復号器

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170822

R150 Certificate of patent or registration of utility model

Ref document number: 6202545

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250