JP6574820B2 - 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス - Google Patents

高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス Download PDF

Info

Publication number
JP6574820B2
JP6574820B2 JP2017165309A JP2017165309A JP6574820B2 JP 6574820 B2 JP6574820 B2 JP 6574820B2 JP 2017165309 A JP2017165309 A JP 2017165309A JP 2017165309 A JP2017165309 A JP 2017165309A JP 6574820 B2 JP6574820 B2 JP 6574820B2
Authority
JP
Japan
Prior art keywords
signal
frequency band
band signal
high frequency
bin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017165309A
Other languages
English (en)
Other versions
JP2017223987A (ja
Inventor
▲澤▼新 ▲劉▼
▲澤▼新 ▲劉▼
磊 苗
磊 苗
峰岩 ▲斉▼
峰岩 ▲斉▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2017223987A publication Critical patent/JP2017223987A/ja
Application granted granted Critical
Publication of JP6574820B2 publication Critical patent/JP6574820B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明の実施形態は、通信技術の分野に、特に高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイスに関する。
デジタル通信の分野では、電話、テレビ会議、テレビ放送、およびマルチメディアエンターテインメントなどの声、画像、音声、および映像の伝送に関して極めて広範な適用要件が存在する。音声信号または映像信号を格納または伝送するプロセスに占めるリソースを削減するために、音声および映像を圧縮および符号化する技術が生まれた。多数の異なる技術的分枝が、音声および映像を圧縮および符号化する技術において出現しており、そこでは、信号が時間領域から周波数領域へと変換された後に符号化処理される技術が、良好な圧縮特徴により幅広く適用され、この技術は、領域変換符号化技術とも呼ばれる。
音声品質は、通信伝送においてますます重視されており、したがって、音声品質が確保される前提で音楽信号品質を可能な限り改善する必要がある。一方では、音声信号の情報量は、極めて豊富であり、したがって従来の音声の符号励振線形予測(Code Excited Linear Prediction、略号はCELP)符号化モードは、適応不可能である。代わりに一般的には、音声信号を処理するために、時間領域信号が、領域変換符号化の音声符号化技術を利用することによって周波数領域信号へと変換され、それにより音声信号の符号化品質を向上させる。
既存の音声符号化技術では、一般的には高速フーリエ変換(Fast Fourier Transform、略号はFFT)または変形離散コサイン変換(Modified Discrete Cosine Transform、略号MDCT)または離散コサイン変換(Discrete Cosine Transform、略号はDCT)などの変換技術を適応することによって、音声信号の高周波帯域信号が時間領域信号から周波数領域信号へと変換され、次いで周波数領域信号が符号化される。
低ビットレートの場合には、限定された量子化ビットは、すべての量子化すべき音声信号を量子化することが不可能であり、したがって符号化デバイスは、音声信号中の比較的重要な低周波帯域信号を緻密に量子化するためにほとんどのビットを使用する。すなわち、低周波帯域信号の量子化パラメータが、ほとんどのビットを占め、わずかに少数のビットのみが、音声信号中の高周波帯域信号を大まかに量子化および符号化して高周波帯域信号の周波数エンベロープを取得するために使用される。次いで、高周波帯域信号の周波数エンベロープおよび低周波帯域信号の量子化パラメータが、ビットストリームの形態で復号デバイスに送られる。低周波帯域信号の量子化パラメータは、励振信号および周波数エンベロープを含み得る。量子化される場合に、低周波帯域信号は、初めにやはり時間領域信号から周波数領域信号へと変換されてもよく、次いで周波数領域信号は、励振信号へと量子化および符号化される。
一般的に、復号デバイスは、低周波帯域信号のおよび受領したビットストリーム中の量子化パラメータに従って低周波帯域信号を復元し、次いで低周波帯域信号に従って低周波帯域信号の励振信号を取得し、帯域幅拡張(band width extension、略号はBWE)技術およびスペクトル充填技術を利用することによってならびに低周波帯域信号の励振信号に従って高周波帯域信号の励振信号を予測し、予測された高周波帯域信号を取得するために高周波帯域信号のおよびビットストリーム中の周波数エンベロープに従って高周波帯域信号の予測された励振信号を修正し得る。本明細書では、取得された高周波帯域信号は、周波数領域信号である。
BWE技術では、ビットが割り当てられる最も高い周波数ビンが、励振信号が復号される最も高い周波数ビンとなり得る。すなわち、最も高い周波数ビンよりも高い周波数ビンでは励振信号は復号されない。ビットが割り当てられる最も高い周波数ビンよりも高い周波数帯域は、高周波帯域と呼ばれ、ビットが割り当てられる最も高い周波数ビンよりも低い周波数帯域は、低周波帯域と呼ばれ得る。高周波帯域信号の励振信号が低周波帯域信号の励振信号に従って予測されるということは、具体的には次のとおりとなり得る。ビットが割り当てられる最も高い周波数ビンは、中心と見なされ、ビットが割り当てられる最も高い周波数ビンよりも低い低周波帯域信号の励振信号は、ビットが割り当てられ低周波帯域信号の帯域幅と同等の帯域幅を有する最も高い周波数ビンよりも高い高周波帯域信号へコピーされ、励振信号は、高周波帯域信号の励振信号として使用される。
本発明を実装するプロセスでは、本発明者らは、少なくとも以下の問題が先行技術に存在することに、すなわち高周波帯域信号を予測するために前述の先行技術を利用することによって、予測される高周波帯域信号の品質が比較的低くなり、それにより音声信号の聴覚的品質が低下するという点に気づいている。
本発明の実施形態は、予測される高周波帯域信号の品質を改善しそれにより音声信号の聴覚的品質を向上させるための、高周波帯域信号を予測するための方法と、符号化デバイスと、復号デバイスとを提供する。
一態様によれば、本発明の一実施形態は、高周波帯域信号を予測するための方法であって、
復号すべき音声信号の信号タイプおよび音声信号の低周波帯域信号を取得するステップと、
信号タイプに従って音声信号の高周波帯域信号の周波数エンベロープを取得するステップと、
音声信号の低周波帯域信号に従って音声信号の高周波帯域信号の励振信号を予測するステップと、
高周波帯域信号の周波数エンベロープおよび高周波帯域信号の励振信号に従って音声信号の高周波帯域信号を復元するステップと
を含む、方法を提供する。
第1の態様を参照として、第1の態様の第1の実装様式では、信号タイプは、調波信号または非調波信号であり、信号タイプに従って高周波帯域信号の周波数エンベロープを取得するステップは、
信号タイプが非調波信号である場合に、音声信号の高周波帯域信号の周波数エンベロープを取得するために音声信号の受領したビットストリームを復号するステップ、または
信号タイプが調波である場合に、音声信号の高周波帯域信号の初期周波数エンベロープを取得するために音声信号の受領したビットストリームを復号し、初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープに加重計算を実施することによって取得される値を高周波帯域信号の周波数エンベロープとして使用するステップであって、Nは1以上である、ステップ
を含む。
第1の態様を参照として、第1の態様の第2の実装様式では、信号タイプは、調波信号または非調波信号であり、信号タイプに従って高周波帯域信号の周波数エンベロープを取得するステップは、
高周波帯域信号の対応する周波数エンベロープを取得するために信号タイプに従って音声信号の受領したビットストリームを復号するステップであって、音声信号のビットストリームは、信号タイプと、高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達する、ステップ
を含む。
第1の態様および第1の態様の前述の実装様式を参照として、第1の態様の第3の実装様式では、音声信号の信号タイプおよび低周波帯域信号を取得するステップは、
信号タイプおよび低周波帯域信号を取得するために音声信号の受領したビットストリームを復号するステップであって、信号タイプは調波信号または非調波信号である、ステップ
を含む。
第1の態様および第1の態様の前述の実装様式を参照として、第1の態様の第4の実装様式では、音声信号の信号タイプおよび低周波帯域信号を取得するステップは、
音声信号の低周波帯域信号を取得するために音声信号の受領したビットストリームを復号するステップと、
低周波帯域信号に従って信号タイプを決定するステップであって、信号タイプは調波信号または非調波信号である、ステップと
を含む。
第1の態様および第1の態様の前述の実装様式を参照として、第1の態様の第5の実装様式では、低周波帯域信号に従って高周波帯域信号の励振信号を予測するステップは、
低周波帯域信号のビットが割り当てられる最も高い周波数ビンを決定するステップと、
低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満であるか否かを判定するステップと、
低周波帯域信号のビットが割り当てられる最も高い周波数ビンが、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満である場合に、所定の周波数帯域範囲内に含まれる、ならびに低周波帯域信号および高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン中の励振信号に従って高周波帯域信号の励振信号を予測するステップ、または
低周波帯域信号のビットが割り当てられる最も高い周波数ビンが、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン以上である場合に、所定の周波数帯域範囲内に含まれる、ならびに低周波帯域信号、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン、および低周波帯域信号のビットが割り当てられる最も高い周波数ビンの中の励振信号に従って高周波帯域信号の励振信号を予測するステップと
を含む。
第1の態様および第1の態様の前述の実装様式を参照として、第1の態様の第6の実装様式では、所定の周波数帯域範囲内に含まれる、ならびに低周波帯域信号および高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンの中の励振信号に従って高周波帯域信号の励振信号を予測するステップは、
所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するステップであって、nは、正の整数または正の小数であり、nは、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の周波数ビンの量の、所定の周波数帯域範囲内の周波数ビンの量に対する比に等しい、ステップ
を含む。
第1の態様および第1の態様の前述の実装様式を参照として、第1の態様の第7の実装様式によれば、所定の周波数帯域範囲内に含まれる、ならびに低周波帯域信号、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン、および低周波帯域信号の最も高い周波数ビンの中の励振信号に従って高周波帯域信号の励振信号を予測するステップは、
所定の周波数帯域範囲の開始周波数ビンfexc_start超の第mの周波数ビンから所定の周波数帯域範囲の終了周波数ビンfexc_endまでの励振信号をコピーし、所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号の2つの部分を低周波帯域信号のビットが割り当てられる最も高い周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するステップであって、nは、0、正の整数、または正の小数であり、mは、低周波帯域信号のビットが割り当てられる最も高い周波数ビンと拡張周波数帯域のプリセット開始周波数ビンとの間の周波数ビンの量の差である、ステップ
を含む。
第2の態様によれば、本発明の一実施形態は、高周波帯域信号を予測するための方法であって、
音声信号の信号タイプおよび音声信号の低周波帯域信号を取得するステップと、
高周波帯域信号の周波数エンベロープの符号化インデックスを取得するために、信号タイプに従って音声信号の高周波帯域信号の周波数エンベロープを符号化するステップと、
信号タイプと低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達するビットストリームを復号デバイスに送るステップと
を含む、方法をさらに提供する。
第2の態様を参照として、第2の態様の一実装様式では、信号タイプは、調波信号または非調波信号であり、高周波帯域信号の周波数エンベロープの符号化インデックスを取得するために信号タイプに従って高周波帯域信号の周波数エンベロープを符号化するステップは、
信号タイプが非調波信号である場合に、第1の量のスペクトル係数を使用することによって高周波帯域信号の周波数エンベロープの符号化インデックスを計算するステップ、または
信号タイプが調波信号である場合に、第2の量のスペクトル係数を使用することによって高周波帯域信号の周波数エンベロープの符号化インデックスを計算するステップであって、第2の量は、第1の量よりも大きい、ステップ
を含む。
第3の態様によれば、本発明の一実施形態は、高周波帯域信号を予測するための方法であって、
音声信号の信号タイプおよび音声信号の低周波帯域信号を取得するステップであって、信号タイプは調波信号または非調波信号であり、音声信号は低周波帯域信号および高周波帯域信号を含む、ステップと、
音声信号の高周波帯域信号の周波数エンベロープを計算するステップであって、同一量のスペクトル係数が、調波信号および非調波信号の高周波帯域信号の周波数エンベロープを計算するために使用される、ステップと、
信号タイプと低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達するビットストリームを復号デバイスに送るステップと
を含む、方法をさらに提供する。
第4の態様によれば、本発明の一実施形態は、
復号すべき音声信号の信号タイプおよび音声信号の低周波帯域信号を取得するように構成された第1の取得モジュールと、
信号タイプに従って音声信号の高周波帯域信号の周波数エンベロープを取得するように構成された第2の取得モジュールと、
音声信号の低周波帯域信号に従って音声信号の高周波帯域信号の励振信号を予測するように構成された予測モジュールと、
高周波帯域信号の周波数エンベロープおよび高周波帯域信号の励振信号に従って音声信号の高周波帯域信号を復元するように構成された復元モジュールと
を備える、復号デバイスをさらに提供する。
第4の態様を参照として、第4の態様の第1の実装様式では、信号タイプは、調波信号または非調波信号であり、第2の取得モジュールは、具体的には、信号タイプが非調波信号である場合には、高周波帯域信号の周波数エンベロープを取得するために音声信号の受領したビットストリームを復号するように構成され、または、第2の取得モジュールは、具体的には、信号タイプが調波である場合には、高周波帯域信号の初期周波数エンベロープを取得するために音声信号の受領したビットストリームを復号し、初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープに加重計算を実施することによって取得される値を高周波帯域信号の周波数エンベロープとして使用するように構成され、Nは、1以上である。
第4の態様を参照として、第4の態様の第2の実装様式では、信号タイプは、調波信号または非調波信号であり、第2の取得モジュールは、具体的には高周波帯域信号の対応する周波数エンベロープを取得するために信号タイプに従って音声信号の受領したビットストリームを復号するように構成され、音声信号のビットストリームは、信号タイプと、高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達する。
第4の態様および第4の態様の前述の実装様式を参照として、第4の態様の第3の実装様式では、第1の取得モジュールは、具体的には信号タイプおよび低周波帯域信号を取得するために音声信号の受領したビットストリームを復号するように構成され、信号タイプは、調波信号または非調波信号である。
第4の態様および第4の態様の前述の実装様式を参照として、第4の態様の第4の実装様式では、第1の取得モジュールは、具体的には、音声信号の低周波帯域信号を取得するために音声信号の受領したビットストリームを復号し、低周波帯域信号に従って信号タイプを決定するように構成され、信号タイプは、調波信号または非調波信号である。
第4の態様および第4の態様の前述の実装様式を参照として、第4の態様の第5の実装様式では、予測モジュールは、
低周波帯域信号のビットが割り当てられる最も高い周波数ビンを決定するように構成された決定ユニットと、
低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満であるか否かを判定するように構成された判断ユニットと、
判断ユニットが、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満であると判定した場合に、所定の周波数帯域範囲内に含まれるならびに低周波帯域信号および高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンの中の励振信号に従って高周波帯域信号の励振信号を予測するように構成された第1の処理ユニットと、
判断ユニットが、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン以上であると判定した場合に、所定の周波数帯域範囲内に含まれるならびに低周波帯域信号、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン、および低周波帯域信号のビンが割り当てられる最も高い周波数ビンの中の励振信号に従って高周波帯域信号の励振信号を予測するように構成された第2の処理ユニットと
を備える。
第4の態様および第4の態様の前述の実装様式を参照として、第4の態様の第6の実装様式では、第1の処理ユニットは、具体的には、判断ユニットが、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満であると判定した場合に、所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、この励振信号のn個のコピーを、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するように構成され、nは、正の整数または正の小数であり、nは、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の周波数ビンの量の、所定の周波数帯域範囲内の周波数ビンの量に対する比に等しい。
第4の態様および第4の態様の前述の実装様式を参照として、第4の態様の第7の実装様式では、第2の処理ユニットは、具体的には、判断ユニットが、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン以上であると判定した場合に、所定の周波数帯域範囲内の開始周波数ビンfexc_start超の第mの周波数ビンから所定の周波数帯域範囲の終了周波数ビンfexc_endまでの励振信号をコピーし、所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号の2つの部分を低周波帯域信号のビットが割り当てられる最も高い周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するように構成され、nは、0、正の整数、または正の小数であり、mは、低周波帯域信号のビットが割り当てられる最も高い周波数ビンと拡張周波数帯域のプリセット開始周波数ビンとの間の周波数ビンの量の差である。
第5の態様によれば、本発明の一実施形態は、
音声信号の信号タイプおよび音声信号の低周波帯域信号を取得するように構成された取得モジュールと、
高周波帯域信号の周波数エンベロープの符号化インデックスを取得するために、信号タイプに従って音声信号の高周波帯域信号の周波数エンベロープを符号化するように構成された符号化モジュールと、
信号タイプと低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達するビットストリームを復号デバイスに送るように構成された送りモジュールと
を備える、符号化デバイスをさらに提供する。
第5の態様を参照として、第5の態様の一実装様式では、信号タイプは、調波信号または非調波信号であり、符号化モジュールは、具体的には、信号タイプが非調波信号である場合に、第1の量のスペクトル係数を使用することによって高周波帯域信号の周波数エンベロープの符号化インデックスを計算するように構成される、または
符号化モジュールは、具体的には、信号タイプが調波信号である場合に、第2の量のスペクトル係数を使用することによって高周波帯域信号の周波数エンベロープの符号化インデックスを計算するように構成され、第2の量は、第1の量よりも大きい。
第6の態様によれば、本発明の一実施形態は、
音声信号の信号タイプおよび音声信号の低周波帯域信号を取得するように構成された取得モジュールであって、信号タイプは、調波信号または非調波信号であり、音声信号は、低周波帯域信号および高周波帯域信号を含む、取得モジュールと、
音声信号の高周波帯域信号の周波数エンベロープを計算するように構成された計算モジュールであって、同一量のスペクトル係数が、調波信号および非調波信号の高周波帯域信号の周波数エンベロープを計算するために使用される、計算モジュールと、
信号タイプと低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達するビットストリームを復号デバイスに送るように構成された送りモジュールと
を備える、符号化デバイスをさらに提供する。
本発明の実施形態における高周波帯域信号を予測するための方法およびシステム、符号化デバイス、ならびに復号デバイスによれば、異なるタイプの信号については、異なるスペクトル係数が、エンベロープを復号するために使用され、それによって低周波数に従って予測される高周波帯域調波信号の励振が、最初の調波特性を維持することが可能となり、それにより予測された高周波帯域信号の品質が改善され、音声信号の聴覚的品質が向上する。
本発明の実施形態におけるまたは先行技術における技術的解決策についてより明確に説明するために、以下では、本実施形態または先行技術について説明するために必要とされる添付の図面を簡単に案内する。自明ではあるが、以下の説明における添付の図面は、本発明のいくつかの実施形態を示し、当業者は、創造的努力を伴わずに添付の図面から他の図面を依然として導き出すことができる。
先行技術における符号化デバイスの概略構造図である。 先行技術における復号デバイスの概略構造図である。 本発明の一実施形態による高周波帯域信号を予測するための方法の流れ図である。 本発明の別の実施形態による高周波帯域信号を予測するための方法の流れ図である。 本発明のさらに別の実施形態による高周波帯域信号を予測するための方法の流れ図である。 本発明の一実施形態による復号デバイスの概略構造図である。 本発明の別の実施形態による復号デバイスの概略構造図である。 本発明の一実施形態による符号化デバイスの概略構造図である。 本発明の別の実施形態による符号化デバイスの概略構造図である。 本発明の一実施形態による符号化デバイスの一例の図である。 本発明の一実施形態による復号デバイスの一例の図である。 本発明の一実施形態による高周波帯域信号を予測するためのシステムの概略構造図である。 本発明の一実施形態による復号デバイスの別の例の図である。 本発明の一実施形態による符号化デバイスの別の例の図である。
本発明の実施形態の目的、技術的解決策、および利点をより明確にするために、以下では、本発明の実施形態内の添付の図面を参照として本発明の実施形態内の技術的解決策について明確にかつ完全に説明する。自明ではあるが、説明される実施形態は、本発明の実施形態の一部であり、すべてではない。創造的努力を伴わずに本発明の実施形態に基づき当業者により実現されるすべての他の実施形態が、本発明の保護範囲に含まれる。
デジタル信号処理の分野では、音声コーデックおよび映像コーデックが、たとえば携帯電話、ワイヤレス装置、パーソナルデジタルアシスタント(PDA)、ハンドヘルドコンピュータまたはポータブルコンピュータ、GPSレシーバ/ナビゲータ、カメラ、音声/映像再生器、カムコーダ、録画機、およびモニタリングデバイスなどの様々な電子デバイスに対して幅広く適用される。一般的には、このタイプの電子デバイスは、音声エンコーダまたは音声デコーダを備え、音声エンコーダまたは音声デコーダは、たとえばDSP(デジタル信号プロセッサ)などのデジタル回路またはチップにより直接的に実装され得るか、またはソフトウェアコード中の処理を実行するためにプロセッサを駆動するソフトウェアコードにより実装され得る。
たとえば、音声エンコーダは、初めに1フレームが20msの時間領域データを取得するために入力信号に対してフレーミング処理を実施し、次いでウィンドーイング後に信号を取得するために時間領域データに対してウィンドーイング処理を実施し、時間領域信号を周波数領域信号へ変換するためにウィンドーイング後に時間領域信号に対して周波数領域変換を実施し、周波数領域信号を符号化し、デコーダ側にこの符号化された周波数領域信号を伝送する。デコーダ側は、エンコーダ側によって伝送される圧縮されたビットストリームの受領後に、信号に対して対応する復号オペレーションを実施し、周波数領域信号を時間領域信号へと変換するために復号によって取得された周波数領域信号に対してエンコーダ側によって利用される変換に対応する逆変換を実施し、合成信号すなわちデコーダ側によって出力される信号を取得するために時間領域信号に対して後処理を実施する。
図1は、先行技術における符号化デバイスの概略構造図である。図1に示すように、先行技術の符号化デバイスは、時間-周波数変換モジュール10、エンベロープ抽出モジュール11、エンベロープ量子化/符号化モジュール12、ビット割当てモジュール13、励振発生モジュール14、励振量子化/符号化モジュール15、および多重化モジュール16を備える。
図1に示すように、時間-周波数変換モジュール10は、入力音声信号を受領し、次いで時間領域信号から周波数領域信号に音声信号を変換するように構成される。次いで、エンベロープ抽出モジュール11は、時間-周波数変換モジュール10による変換によって取得された周波数領域信号から周波数エンベロープを抽出する。周波数エンベロープは、サブバンド正規化因子とも呼ばれ得る。本明細書では、周波数エンベロープは、低周波帯域信号の周波数エンベロープと、高周波帯域信号の周波数エンベロープとを含み、低周波帯域信号および高周波帯域信号は、周波数領域信号中に存在する。エンベロープ量子化/符号化モジュール12は、量子化および符号化された周波数エンベロープを取得するために、エンベロープ抽出モジュール11によって取得された周波数エンベロープに対して量子化/符号化処理を実施する。ビット割当てモジュール13は、量子化された周波数エンベロープに従って各サブバンドのビット割当てを決定する。励振発生モジュール14は、励振信号すなわち正規化された周波数領域信号を取得するために、エンベロープ量子化/符号化モジュール12による量子化および符号化の後に取得されるエンベロープ情報を使用することによって、時間-周波数変換モジュール10により取得された周波数領域信号に対して正規化処理を実施し、また、励振信号は、高周波帯域信号の励振信号と、低周波帯域信号の励振信号とを含む。励振量子化/符号化モジュール15は、量子化された励振信号を取得するために、ビット割当てモジュール13によって割り当てられた各サブバンドのビット割当てに従って、励振発生モジュール14により発生された励振信号に対して量子化/符号化処理を実施する。多重化モジュール16は、エンベロープ量子化/符号化モジュール12によって量子化された周波数エンベロープと、励振量子化/符号化モジュール15によって量子化された励振信号とをビットストリームに個別に多重化し、復号デバイスにこのビットストリームを出力する。
図2は、先行技術における復号デバイスの概略構造図である。図2に示すように、先行技術の復号デバイスは、逆多重化モジュール20、周波数エンベロープ復号モジュール21、ビット割当て取得モジュール22、励振信号復号モジュール23、帯域幅拡張モジュール24、周波数領域信号復元モジュール25、および周波数-時間変換モジュール26を備える。
図2に示すように、逆多重化モジュール20は、符号化デバイスの側から送られるビットストリームを受領し、量子化された周波数エンベロープおよび量子化された励振信号を個別に取得するためにこのビットストリームを逆多重化(復号を含む)する。周波数エンベロープ復号モジュール21は、逆多重化モジュール20による逆多重化によって取得された信号から量子化された周波数エンベロープを取得し、周波数エンベロープを取得するためにこの量子化された周波数エンベロープを量子化および復号する。ビット割当て取得モジュール22は、周波数エンベロープ復号モジュール21によって取得された周波数エンベロープに従って各サブバンドのビット割当てを決定する。励振信号復号モジュール23は、逆多重化モジュール20により逆多重化されることによって取得される信号から量子化された励振信号を取得し、励振信号を取得するために、ビット割当て取得モジュール22により取得された各サブバンドのビット割当てに従って量子化および復号を実施する。帯域幅拡張モジュール24は、励振信号復号モジュール23により取得された励振信号に従ってすべての帯域幅に対して励振を実施する。具体的には、帯域幅拡張モジュール24は、低周波帯域信号の励振信号を使用することによって高周波帯域信号の励振信号を拡張する。励振信号およびエンベロープ信号を量子化および符号化する場合に、励振量子化/符号化モジュール15およびエンベロープ量子化/符号化モジュール12は、比較的重要な低周波帯域信号の信号を量子化するためにほとんどのビットを使用し、高周波帯域信号の励振信号が除外される場合さえもある高周波帯域信号の信号を量子化するためにはわずかに少数のビットのみを使用する。したがって、帯域幅拡張モジュール24は、すべての周波数帯域の励振信号を取得するために、高周波帯域信号の励振信号を拡張するように低周波帯域信号の励振信号を使用することを必要とする。周波数領域信号復元モジュール25は、周波数エンベロープ復号モジュール21および帯域幅拡張モジュール24に個別に接続され、周波数領域信号復元モジュール25は、周波数エンベロープ復号モジュール21によって取得された周波数エンベロープと、すべての周波数帯域のものであり帯域幅拡張モジュール24によって取得された励振信号とに従って周波数領域信号を復元する。周波数-時間変換モジュール26は、周波数領域信号復元モジュール25により復元された周波数領域信号を時間領域信号に変換し、それにより最初に入力された音声信号を取得する。
図1および図2は、先行技術における符号化デバイスおよび対応する復号デバイスの構造図である。図1および図2に示す先行技術の符号化デバイスおよび復号デバイスの処理プロセスによれば、先行技術では、低周波帯域信号のものであり復号デバイスが低周波帯域信号の周波数領域信号を復元する場合に使用される励振信号およびエンベロープ情報が、符号化デバイスの側から送られることに気付かれよう。したがって、低周波帯域信号の周波数領域信号の復元は、比較的正確である。高周波帯域信号の周波数領域信号については、初めに高周波帯域信号の励振信号を予測するために低周波帯域信号の励振信号を使用し、次いで高周波帯域信号の周波数領域信号を取得するために高周波帯域信号のものであり符号化デバイスの側から送られるエンベロープ情報を使用して高周波帯域信号の予測された励振信号を修正することが必要となる。高周波帯域信号の周波数領域信号を予測する場合に、符号化デバイスは、信号タイプを考慮せず、同一周波数エンベロープを使用する。たとえば、信号タイプが調波信号である場合に、使用される周波数エンベロープによって対応されるサブバンド範囲は、比較的狭い(ある調波の山から谷にかけて対応されるサブバンド範囲未満である)。周波数エンベロープが、高周波帯域信号の予測される励振信号を修正するために使用される場合には、より多くのノイズがもたらされ、したがって比較的大きい誤差が、修正によって取得される高周波帯域信号と実高周波帯域信号との間に存在して、高周波帯域信号を予測する精度に著しい影響を及ぼし、予測される高周波帯域信号の品質を低下させ、音声信号の聴覚的品質を低下させる。さらに、高周波帯域信号の励振信号が低周波帯域信号の励振信号に従って予測される前述の先行技術を利用することによって、異なる低周波帯域信号の励振信号が、異なるフレームの同一の高周波帯域信号にコピーされ得るため、励振信号の不連続化を引き起こし、予測される高周波帯域信号の品質を低下させ、それにより音声信号の聴覚的品質を低下させる。したがって、本発明の実施形態の以下の技術的解決策は、前述の技術的問題を解決するために使用され得る。
図3は、本発明の一実施形態による高周波帯域信号を予測するための方法の流れ図である。この実施形態では、高周波帯域信号を予測するための方法は、復号デバイスによって実行され得る。図3に示すように、この実施形態では、高周波帯域信号を予測するための方法は、具体的には以下のステップを含み得る。
100.復号デバイスが、音声信号の信号タイプと音声信号の低周波帯域信号とを取得する。
この実施形態では、信号タイプは、調波信号または非調波信号であり、音声信号は、低周波帯域信号および高周波帯域信号を含む。一実施形態では、音声信号の信号タイプは、音声信号の高周波帯域信号の信号タイプであり、すなわち高周波帯域信号が調波信号または非調波信号のいずれであるかとなる。
101.復号デバイスが、信号タイプに従って高周波帯域信号の周波数エンベロープを取得する。
102.復号デバイスが、低周波帯域信号に従って高周波帯域信号の励振信号を予測する。
103.復号デバイスが、高周波帯域信号の周波数エンベロープおよび高周波帯域信号の励振信号に従って高周波帯域信号を復元する。
この実施形態では、予測によって取得される高周波帯域信号は、周波数領域信号である。
この実施形態における高周波帯域信号を予測するための方法によれば、高周波帯域信号の周波数エンベロープは、信号タイプに従って取得され、異なるタイプの信号については、異なるスペクトル係数が、エンベロープを復号するために使用され、それにより高周波帯域調波信号のものであり低周波帯域信号により予測される励振は、最初の調波特徴を維持することが可能となり、それにより予測プロセスに過剰ノイズがもたらされるのを回避し、予測によって取得される高周波帯域信号と実高周波帯域信号との間に存在する誤差を効果的に縮小し、予測される高周波帯域信号の精度を上昇させる。
任意には、前述の実施形態の技術的解決策に基づき、図3に示す実施形態のものであり以下の拡張技術解決策によって形成される拡張実施形態もまた含まれてもよい。この拡張実施形態では、ステップ101で、「復号デバイスが、信号タイプに従って高周波帯域信号の周波数エンベロープを取得する」が、以下の2つの場合を具体的に含み得る。
第1の場合では、信号タイプが非調波信号である場合には、復号デバイスは、高周波帯域信号の周波数エンベロープを取得するために受領したビットストリームを復号する。信号タイプが調波信号である場合には、復号デバイスは、高周波帯域信号の初期周波数エンベロープを取得するために受領したビットストリームを復号し、初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープに加重計算を実施することによって取得される値を高周波帯域信号の周波数エンベロープとして使用する。ここで、Nは1以上である。
この場合には、調波信号または非調波信号にかかわらず、高周波帯域信号のものであり復号デバイスによる受領したビットストリームの復号によって取得される周波数エンベロープは、同一となる。非調波信号については、高周波帯域信号のものであり復号によって取得される周波数エンベロープは、高周波帯域信号のものであり取得される必要のある周波数エンベロープとなる。調波信号については、高周波帯域信号のものであり復号デバイスにより復号することによって取得される周波数エンベロープは、高周波帯域信号の初期周波数エンベロープであり、初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープに加重計算を実施することによって取得される値を高周波帯域信号の周波数エンベロープとしてさらに使用する必要がある。ここで、Nは1以上である。このようにすることで、高周波帯域信号のものであり調波信号に対応している周波数エンベロープにより対応されるサブバンドの幅が、高周波帯域信号のものであり非調波信号に対応している周波数エンベロープにより対応されるサブバンドの幅よりも広いことに気付かれよう。
Nの値は、調波信号の高周波帯域信号の周波数エンベロープにより対応されるサブバンドの幅と、非調波信号の高周波帯域信号の周波数エンベロープにより対応されるサブバンドの幅とに従って決定され得る。たとえば、前述の実施形態では、信号タイプが調波信号である場合には、各サブバンドに40個のスペクトル係数が存在し、信号タイプが非調波信号である場合には、各サブバンドに24個のスペクトル係数が存在する。復号デバイスが、信号タイプが調波信号であり、高周波帯域信号のものでありビットストリーム中で伝達される周波数エンベロープが非調波信号に対応する周波数エンベロープであると判定した場合には、この場合には、ビットストリーム中の2つの隣接し合う周波数エンベロープは、調波信号に対応する周波数エンベロープを取得するために平均化され得る。
たとえば、超広域帯信号については、8kHz〜14kHzの範囲内に240個のスペクトル係数が存在する。信号タイプが調波信号である場合には、240個のスペクトル係数は6つのサブバンドへと均等に分類されてもよく、各サブバンドには40個のスペクトル係数が存在し、1つの周波数エンベロープが各サブバンドについて計算され、6つの周波数エンベロープが合計で計算される。しかしながら、信号タイプが非調波信号である場合には、240個のスペクトル係数は10個のサブバンドへと均等に分類され、24個のスペクトル係数が各サブバンドに存在し、1つの周波数エンベロープが各サブバンドについて計算され、10個の周波数エンベロープが合計で計算される。
第2の例では、ビットストリームが、高周波帯域信号の対応する周波数エンベロープを取得するために信号タイプに従って復号される。ビットストリームは、信号タイプと、高周波帯域信号の周波数エンベロープのものであり信号タイプに対応している符号化インデックスとを含む。
ステップ101の前述の第1の実装例では、復号デバイスは、音声信号の信号タイプ、すなわち調波信号または非調波信号に関する情報を取得する必要がある。種々の実装様式が存在し得る。一実装様式では、符号化デバイスが、音声信号の信号タイプを決定し、信号タイプを符号化し、復号デバイスに符号化された信号タイプを伝送する。他の実装様式では、復号デバイスが、復号によって取得された低周波帯域信号に従って音声信号のタイプを決定する。本明細書では、音声信号の信号タイプは、具体的には音声信号の高周波帯域信号の信号タイプを指し得、すなわち高周波帯域信号が調波信号または非調波信号のいずれであるかを指し得る。
調波信号は、処理すべき周波数帯域内で激しく変動する周波数スペクトル振幅を有する信号を示し、ある特定量の振幅ピークがある特定の周波数帯域内に存在することを表し得る。既存の方法は、音声信号が調波信号または非調波信号のいずれであるかを判定するためにエンコーダ側またはデコーダ側によって使用され得る。たとえば、一方法では、周波数領域信号がN個のサブバンドに分割され、各サブバンドのピーク対平均値比(ピーク対平均値比は、サブバンド内で最大となる振幅を有するスペクトル係数の、サブバンド内の平均振幅値に対する比である)が計算され、ピーク対平均値比がサブバンドの量だけ所与のしきい値よりも高く、サブバンドの量が所与の値よりも高い場合に、この場合には、信号は調波信号であり、そうでない場合には信号は非調波信号となる。
「復号デバイスが、音声信号の信号タイプと音声信号の低周波帯域信号とを取得する」というステップ100は、具体的には以下の2つの様式を含む。
第1の様式では、復号デバイスは、信号タイプおよび低周波帯域信号を取得するために受領したビットストリームを復号する。低周波帯域信号の量子化パラメータは、具体的には低周波帯域信号を一義的に識別するために使用され得る点に留意されたい。したがって、低周波帯域信号を取得するために受領したビットストリームを復号することは、具体的には低周波帯域信号の量子化パラメータを取得することであってもよい。
この場合には、符号化デバイスによって送られ復号デバイスによって受領されるビットストリームは、信号タイプと、低周波帯域信号の量子化パラメータと、高周波帯域信号の周波数エンベロープとを伝達する。この場合には、調波信号または非調波信号のいずれにかかわらず、高周波帯域信号の周波数エンベロープは、同一である。これに対応して、信号タイプが調波信号または非調波信号のいずれであるかが、符号化デバイスの側によって決定される。しかしながら、符号化デバイスは、信号タイプに従って高周波帯域信号の周波数エンベロープを調節せず、代わりに、符号化デバイスは、本来の音声信号に従って高周波帯域信号の周波数エンベロープを決定する。その一方で、符号化デバイスは、低周波帯域信号をさらに決定する必要がある。この場合に、符号化デバイスは、信号タイプ、低周波帯域信号の符号化インデックス、および高周波帯域信号の周波数エンベロープを伝達するビットストリームを復号デバイスに送る。一般的には、高周波帯域信号の調波特性は、低周波帯域信号の調波特性と一致する。しかしながら、低周波帯域信号の調波特性が強く、高周波帯域信号が場合によっては調波を有さないという特殊な場合もまた存在する。したがって、この実施形態では、音声信号のものであり符号化デバイスによって取得される信号タイプは、高周波帯域信号の信号タイプであってもよく、または低周波帯域信号の信号タイプであってもよい。前者の様式は、後者の場合と比較してより正確である。
第2の様式では、復号デバイスは、低周波帯域信号を取得するためにビットストリームを逆多重化し、低周波帯域信号に従って信号タイプを決定する。
前述の第1の様式と比較すると、この様式では、信号タイプは、符号化デバイスによって送られ復号デバイスによって受領されるビットストリーム中では伝達されない。代わりに、信号タイプは、逆多重化によって取得される低周波帯域信号に従って復号デバイスによって決定される。同様に、低周波帯域信号の量子化パラメータは、低周波帯域信号を一義的に識別するために使用され得る。任意には、また、この様式では、符号化デバイスによって送られるビットストリームは、低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスのみを伝達してもよい。ビットストリームの受領後に、復号デバイスは、低周波帯域信号を取得するためにビットストリームを逆多重化し、低周波帯域信号に従って信号タイプを決定する。この様式が符号化デバイスの側に適用される場合には、先行技術が利用されてもよい。すなわち、信号タイプを決定する必要はなく、復号デバイスに送られるビットストリームは、信号タイプを伝達しない。符号化デバイスの側における処理に関する詳細については、関連する先行技術を参照されたい。本明細書では詳細について再度説明しない。前者の様式と比較して、この実装様式は、符号化ビットをさらに減少させ得る。
前述の第2の実装例のステップ101については復号デバイスは、高周波帯域信号の対応する周波数エンベロープを取得するために信号タイプに従ってビットストリームを復号する必要があり、すなわち高周波帯域信号の周波数エンベロープは、対応する符号化デバイスの側の信号タイプに従ってビットストリームに符号化される必要がある。たとえば、信号タイプが調波信号である場合には、符号化デバイスは、高周波帯域信号の周波数エンベロープを符号化するために4ビットを使用してもよく、信号タイプが非調波信号である場合には、符号化デバイスは、高周波帯域信号の周波数エンベロープを符号化するために5ビットを使用してもよい。したがって、この場合には、復号デバイスによって受領されるビットストリームは、信号タイプを伝達する必要がある。したがって、第2の例のステップ101では、前述の第2の様式はステップ100を実装するために利用され得ない。
任意には、図3に示す実施形態の拡張実施形態において、「復号デバイスが、低周波帯域信号に従って高周波帯域信号の励振信号を予測する」ステップ102は、具体的には関連する従来技術を利用することによって実装されてもよく、または好ましくは具体的には以下のステップを利用することによって実装されてもよい。
(1)復号デバイスが、低周波帯域信号のビットが割り当てられる最も高い周波数ビンを決定する。
たとえば、復号デバイスは、符号化デバイスによって送られた受領したビットストリーム中の低周波帯域信号に従ってビットが割り当てられる最も高い周波数ビンを決定してもよい。低周波帯域信号の量子化パラメータが、低周波帯域信号を一義的に識別するために使用される場合には、ビットが割り当てられる最も高い周波数ビンは、低周波帯域信号の量子化パラメータに従って決定されてもよい。たとえば、この実施形態では、flast_sfmが、ビットが割り当てられる最も高い周波数ビンを示すために使用される。
(2)復号デバイスは、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満であるか否かを判定する。低周波帯域信号のビットが割り当てられる最も高い周波数ビンが、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満である場合には、ステップ(3)が実施される。あるいは、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン以上である場合には、ステップ(4)が実施される。
(3)復号デバイスが、所定の周波数帯域範囲内に含まれる、ならびに低周波帯域信号と高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンとの中の励振信号に従って、高周波帯域信号の励振信号を予測する。
(4)復号デバイスが、所定の周波数帯域範囲内に含まれる、ならびに低周波帯域信号、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン、および低周波帯域信号のビットが割り当てられる最も高い周波数ビンの中の励振信号に従って、高周波帯域信号の励振信号を予測する。
さらに任意には、復号デバイスが、所定の周波数帯域範囲内に含まれる、ならびに低周波帯域信号および高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンの中の励振信号に従って、高周波帯域信号の励振信号を予測するステップ(3)は、
所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、この励振信号のn個のコピーを、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用する
ことを含む。
この実施形態では、nは、正の整数または正の小数であり、nは、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の周波数ビンの量の、所定の周波数帯域範囲内の周波数ビンの量に対する比に等しい。
たとえば、この実施形態では、fbwe_startが、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンを示すために使用され得る。fbwe_startの選択は、符号化レート(すなわちビットの合計量)に関連する。より高い符号化レートは、高周波帯域信号の帯域幅拡張のより高いプリセット開始周波数ビンfbwe_startが選択され得ることを示唆する。たとえば、超広域信号については、符号化レートが24kbpsである場合には、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンfbwe_startは、6.4kHzに等しく、符号化レートが32kbpsである場合には、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンfbwe_startは、8kHzに等しい。
たとえば、この実施形態では、所定の周波数帯域範囲内に含まれるおよび低周波帯域信号中の励振信号は、fexc_start〜fexc_endの周波数帯域範囲内に含まれるおよび低周波帯域信号中の励振信号として示され得る。ここで、fexc_startは、所定の周波数帯域範囲のものである低周波帯域信号中の開始周波数ビンであり、fexc_endは、所定の周波数帯域範囲のものである低周波帯域信号中の終了周波数であり、fexc_endは、fexc_startよりも高い。fexc_start〜fexc_endの所定の周波数帯域範囲の選択は、信号タイプおよび符号化レートに関連する。たとえば、比較的低いレートの場合には、調波信号について、低周波帯域信号で比較的良好な符号化を伴う比較的低周波の帯域信号が選択され、非調波信号については、低周波帯域信号で比較的劣悪な符号化を伴う比較的高周波の帯域信号が選択される。比較的高いレートの場合には、調波信号については、低周波帯域信号中の比較的高周波の帯域信号が選択され得る。
たとえば、この実施形態では、帯域幅拡張周波数帯域の最も高い周波数ビンが、ftop_sfmとして示され得る。
この場合には、fexc_start〜fexc_endの周波数帯域範囲内の励振信号のn個のコピーが、fbwe_startとftop_sfmとの間の励振信号として使用される。ここで、nは、fbwe_startとftop_sfmとの間の周波数ビンの量の、fexc_start〜fexc_endの範囲内の周波数ビンの量に対する比に等しく、具体的には正の整数または正の小数であってもよい。
この実施形態では、復号デバイスが、fbwe_startから開始して、fexc_start〜fexc_endの周波数帯域範囲内の励振信号のn個のコピーを作製し、この励振信号のn個のコピーを高周波帯域信号のものでありfbwe_startとftop_sfmとの間の励振信号として使用することは、具体的には以下の様式で実装され得る。復号デバイスが、fbwe_startから開始して、fexc_start〜fexc_endの周波数帯域範囲内に含まれnの整数部分の量中の励振信号を連続的にコピーし、fexc_start〜fexc_endの周波数帯域範囲内に含まれnの非整数部分の量中の励振信号をコピーし、これらの2つの部分の励振信号をfbwe_startとftop_sfmとの間の高周波帯域励振信号として使用する。ここで、nの非整数部分は1未満である。
この実施形態では、fexc_start〜fexc_endの周波数帯域範囲内に含まれnの整数部分の量中の低周波帯域励振信号が、コピーされつつある場合に、励振信号は、連続的にコピーされ得る、すなわちfexc_start〜fexc_endの周波数帯域範囲内の励振信号の1つのコピーが、fexc_start〜fexc_endの周波数帯域範囲内の励振信号のn個のコピーが作製されるまで、毎回作製される。または、ミラーコピー(またはフォールドコピーとも呼ばれる)が実施されてもよい、すなわち、fexc_start〜fexc_endの周波数帯域範囲内の励振信号の整数コピーが作製されつつある場合に、順方向コピー(すなわちfexc_startからfexc_endへ)と逆方向コピー(すなわちfexc_endからfexc_startへ)との交互コピーが、n個のコピーが完了するまで連続的に実施される。
代替的には、復号デバイスが、ftop_sfmから開始して、fexc_start〜fexc_endの周波数帯域範囲内の励振信号のn個のコピーを作製してもよく、この励振信号のn個のコピーをfbwe_startとftop_sfmとの間の高周波帯域励振信号として使用してもよい。これは、具体的には以下の様式で実装され得る。復号デバイスが、ftop_sfmから開始して、fexc_start〜fexc_endの周波数帯域範囲内に含まれnの非整数部分の量中の励振信号を連続的にコピーし、fexc_start〜fexc_endの周波数帯域範囲内に含まれnの整数部分の量中の励振信号をコピーし、これらの2つの部分の励振信号をfbwe_startとftop_sfmとの間の高周波帯域励振信号として使用する。ここで、nの非整数部分は1未満である。
具体的には、ftop_sfmから開始して、fexc_start〜fexc_endの周波数帯域範囲内のnの非整数部分の量中の励振信号をコピーすることは、ブロックによるコピーに属する。たとえば、高周波帯域信号の最も高い周波数ビンは14kHzであり、fexc_start〜fexc_endは1.6kHz〜4kHzである。fexc_start〜fexc_endのすなわち1.6kHz〜2.8kHzの0.5コピーの励振信号が、このステップの解決策を利用することによって選択されることとなる場合には、1.6kHz〜2.8kHzの励振信号は、(14〜1.2)kHz〜14kHzの間の帯域幅拡張周波数帯域にコピーされ、この高周波帯域信号の励振信号として使用され得る。この場合には、1.6kHzは、(14〜1.2)kHzに対応してコピーされ、2.8kHzは、14kHzに対応してコピーされる。
前述の2つの様式では、fbwe_startまたはftop_sfmのいずれからコピーの実施を開始するかにかかわらず、fbwe_startとftop_sfmとの間であり最終的には予測によって取得される高周波帯域励振信号の結果は、同一となる。
前述の解決策の一実装プロセスでは、比nは、初めに、fexc_startとfexc_endとの間の周波数ビンの量によりfbwe_startとftop_sfmとの間の周波数ビンの量を除算することによって計算されてもよい。
さらに任意には、復号デバイスが、所定の周波数帯域範囲内に含まれる、ならびに低周波帯域信号と、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンと、低周波帯域信号のビットが割り当てられる最も高い周波数ビンとの中の励振信号に従って、高周波帯域信号の励振信号を予測するステップ(4)は、
所定の周波数帯域範囲の開始周波数ビンfexc_startを超える第mの周波数ビンから所定の周波数帯域範囲の開始周波数ビンfexc_startまでの励振信号をコピーし、所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、低周波帯域信号のビットが割り当てられる最も高い周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として励振信号の2つの部分を使用すること
を含む。
この実施形態では、nは、0、正の整数、または正の小数であり、mは、低周波帯域信号のビットが割り当てられる最も高い周波数ビンと拡張周波数帯域のプリセット開始周波数ビンとの間の周波数ビンの量であり、(flast_sfm-fbwe_start)として示され得る。
この場合には、fbwe_start〜ftop_sfmよりも高い第(flast_sfm-fbwe_start)の周波数からの励振信号がコピーされ、fexc_start〜fexc_endの周波数帯域範囲内の励振信号のn個のコピーが作製され、励振信号の2つの部分が、flast_sfmとftop_sfmとの間の励振信号として使用される。ここで、nは、0、正の整数、または正の小数であり得る。
特定の実装時に、復号デバイスは、flast_sfmから開始して、(fexc_start+(flast_sfm-fbwe_start))の周波数帯域範囲内励振信号と、fexc_start〜fexc_endのおよびnの非整数部分の量中の励振信号と、fexc_start〜fexc_endの周波数帯域範囲内に含まれnの非整数部分の量中の励振信号とを連続的にコピーし、これらの励振信号の3つの部分をflast_sfmとftop_sfmとの間の高周波帯域励振信号として使用し得る。ここで、nの非整数部分は、1未満である。
代替的には、復号デバイスは、ftop_sfmから開始して、fexc_start〜fexc_endの励振信号のn個のコピーを連続的に作製し、(fexc_start+(flast_sfm-fbwe_start))〜fexc_endの周波数帯域範囲内の励振信号をコピーし、これらの励振信号の2つの部分をflast_sfmとftop_sfmとの間の高周波帯域励振信号として使用し得る。ここでも同様に、nは、0、正の整数、または正の小数である。
特定の実装時に、復号デバイスは、ftop_sfmから開始して、fexc_start〜fexc_endの周波数帯域範囲内に含まれnの非整数部分の量中の励振信号と、fexc_start〜fexc_endの周波数帯域範囲内に含まれnの整数部分の量中の励振信号と、(fexc_start+(flast_sfm-fbwe_start))〜fexc_endの周波数帯域範囲内の励振信号とを連続的にコピーし、これらの励振信号の3つの部分をflast_sfmとftop_sfmとの間の高周波帯域励振信号として使用し得る。ここで、nの非整数部分は、1未満である。
復号デバイスが、fexc_startから予測の実施を開始する場合には、fexc_start〜fexc_endの周波数帯域範囲内に含まれnの非整数部分の量中の励振信号をコピーすることは、ブロックによるコピーにやはり属する。低周波帯域範囲内の低周波数ビンに対応する励振信号が、高周波帯域中の対応する低周波数ビンに位置し、低周波帯域範囲内の高周波数ビンに対応する励振信号が、高周波帯域中の対応する高周波数ビンに位置する。詳細については、前述の関連記載を参照されたい。同様に、fexc_start〜fexc_endの周波数帯域範囲内に含まれnの整数部分の量中の低周波帯域励振信号のコピーもまた、連続コピーまたはミラーコピーであってもよい。詳細については、前述の関連記載を参照されたい。本明細書では詳細について再度説明しない。
前述の2つの様式では、flast_sfmまたはftop_sfmのいずれからflast_sfmとftop_sfmとの間の高周波帯域励振信号の予測を開始するかにかかわらず、flast_sfmとftop_sfmとの間であり予測により最終的に取得される高周波帯域励振信号の結果は、同一となる。
さらに、前述の解決策では、(fexc_start+(flast_sfm-fbwe_start))〜fexc_endの帯域幅が、flast_sfmとftop_sfmとの間の周波数ビンの量以上である場合には、(fexc_start+(flast_sfm-fbwe_start))〜fexc_endの帯域幅中の(fexc_start+(flast_sfm-fbwe_start))から開始して、flast_sfm〜ftop_sfmの周波数ビン範囲を有する励振信号を取得し、この励振信号をflast_sfmとftop_sfmとの間の励振信号として使用することが必要となるにすぎない。
前述の解決策の実装プロセスでは、比すなわちnは、初めに、fexc_startとfexc_endとの間の周波数ビンの量により(fexc_start+(flast_sfm-fbwe_start))と、flast_sfmとftop_sfmとの間の周波数ビンの量との間の差を除算することによって取得するために計算されてもよい。ここで、nは、0、正の整数、または正の小数であり得る。
たとえば、符号化レートが24kbpsである場合には、fbwe_startは6.4kHzに等しく、ftop_sfmは14kHzである。高周波帯域信号の励振信号は、以下の様式で予測される。所定の低周波帯域信号の拡張範囲は、0kHz〜4kHzであり、第Nのフレーム中のビットが割り当てられる最も高い周波数flast_sfmは、8kHzであると仮定する。この場合に、flast_sfmは、fbwe_start超である。したがって、第1の自己適合正規化処理が、0kHz〜4kHzである拡張範囲を有する低周波帯域信号の選択された励振信号に対して実施され(自己適合正規化処理のある特定のプロセスについては前述の実施形態中の記載を参照されたい。本明細書では詳細について再度説明しない)、次いで、8kHz超の高周波帯域信号の励振信号が、低周波帯域信号の正規化された励振信号に従って予測される。前述の実施形態における様式によれば、低周波帯域信号の選択された正規化された励振信号をコピーするためのシーケンスは、次のとおりである。初めに、(8kHz〜6.4kHz)〜4kHzの低周波帯域範囲内の励振信号がコピーされ、次いでfexc_start〜fexc_end(0kHz〜4kHz)の低周波帯域範囲の0.9コピー内の励振信号がコピーされ、すなわち0kHz〜3.6kHzの低周波帯域範囲内の励振信号がコピーされ、これらの励振信号の2つの部分が、ビットが割り当てられる最も高い周波数(flast_sfm=8kHz)と高周波帯域信号の最も高い周波数ftop_sfm(ftop_sfm=14kHz)との間の高周波帯域励振信号として使用される。第(N+1)のフレーム中のビットが割り当てられる最も高い周波数が、6.4kHz以下である(高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンfbwe_startが6.4kHzに等しい)場合には、自己適合正規化処理が、低周波帯域信号のものであり0kHz〜4kHz内の周波数帯域範囲内の選択された励振信号に対して実施され、次いで、6.4kHz超の高周波帯域信号の励振信号が、低周波帯域信号の正規化された励振信号に従って予測される。前述の実施形態における様式によれば、低周波帯域信号の選択された正規化された励振信号をコピーするためのシーケンスは、次のとおりである。初めに、fexc_start〜fexc_end(0kHz〜4kHz)の低周波帯域範囲の励振信号の1つのコピーが作製され、次いでfexc_start〜fexc_end(0kHz〜4kHz)の低周波帯域範囲の0.9コピー内の励振信号がコピーされ、これらの励振信号の2つの部分は高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン(fbwe_start=6.4kHz)と高周波帯域信号の最も高い周波数ftop_sfm(ftop_sfm=14kHz)との間の高周波帯域励振信号として使用される。
高周波帯域信号の最も高い周波数ビンは、周波数領域信号のタイプに従って決定される。たとえば、周波数領域信号のタイプが、超広域信号である場合には、高周波帯域信号の最も高い周波数ftop_sfmは、14kHzである。一般的に、符号化デバイスおよび復号デバイスは、相互との通信前に伝送すべき周波数領域信号のタイプを決定しており、したがって周波数領域信号の最も高い周波数ビンは、決定されていると見なされてもよい。
前述の技術的解決策を利用することによって前述の実施形態における高周波帯域信号を予測するための方法によれば、調波信号および非調波信号については、異なるエンベロープ情報が、高周波帯域信号を予測するために使用され、それにより予測プロセスに過剰ノイズがもたらされるのを回避し、修正によって取得される高周波帯域信号と実高周波帯域信号との間に存在する誤差を効果的に縮小し、予測される高周波帯域信号の精度を上昇させる。
さらに、高周波帯域信号の励振信号の前述の予測から、第Nのフレームおよび第(N+1)のフレーム中の帯域幅拡張の開始周波数ビンが異なっても、8kHz超の同一の周波数帯域の励振信号が、低周波帯域信号の同一周波数帯域の励振信号からの予測によって所得され、したがってフレームの連続性が確保され得ることに気付かれよう。
前述の実施形態の技術的解決策を利用することによって、高周波帯域信号のものであり前者のフレームおよび後者のフレーム中で予測される励振信号の連続性は、効果的に確保され得るため、それにより復元された高周波帯域信号の聴覚的品質が確保され、音声信号の聴覚的品質が向上する。
図4は、本発明の別の実施形態による高周波帯域信号を予測するための方法の流れ図である。この実施形態では、高周波帯域信号を予測するための方法は、符号化デバイスによって実行され得る。図4に示すように、この実施形態では、高周波帯域信号を予測するための方法は、具体的には以下のステップを含み得る。
200.符号化デバイスが、音声信号の信号タイプと音声信号の低周波帯域信号とを取得する。ここで、この実施形態の信号タイプは、調波信号または非調波信号であり、この実施形態の音声信号は、低周波帯域信号および高周波帯域信号を含む。
201.符号化デバイスが、高周波帯域信号の周波数エンベロープを取得するために信号タイプに従って高周波帯域信号の周波数エンベロープを符号化する。
202.符号化デバイスが、信号タイプ、低周波帯域信号、および高周波帯域信号の周波数エンベロープを伝達するビットストリームを復号デバイスに送る。
この実施形態では、本発明の実施形態における技術的解決策が、符号化デバイスの側で説明され、この実施形態では、ビットストリームは、信号タイプと、低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達する。
これに対応して、復号デバイスの側では、復号デバイスは、ビットストリームを受領し、信号タイプおよび低周波帯域信号を取得するために受領したビットストリームを逆多重化し、次いで、高周波帯域信号の対応する周波数エンベロープを取得するために信号タイプに従って受領したビットストリームを復号する。次いで、復号デバイスは、低周波帯域信号に従って高周波帯域信号の励振信号を予測し、高周波帯域信号の周波数エンベロープと高周波帯域信号の励振信号とに従って高周波帯域信号を復元する。具体的には、この実施形態は、復号デバイスによって受領されたビットストリームが、信号タイプと、低周波帯域信号の量子化パラメータの符号化インデックスおよび図3に示す実施形態の前述の拡張実施形態の高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達するものに対応している。具体的な一実装プロセスの詳細については、図3に示す実施形態の前述の拡張実施形態における関連記載を参照されたい。本明細書では詳細について再度説明しない。
この実施形態で高周波帯域信号を予測するための方法によれば、符号化デバイスは、信号タイプおよび低周波帯域信号を取得し、高周波帯域信号の周波数エンベロープを取得するために信号タイプに従って高周波帯域信号の周波数エンベロープを符号化し、信号タイプ、低周波帯域信号、および高周波帯域信号の周波数エンベロープを伝達するビットストリームを復号デバイスに送り、それによって復号デバイスは、低周波帯域信号の量子化パラメータおよび信号タイプを取得するためにこのビットストリームを復号し、信号タイプに従って高周波帯域信号の周波数エンベロープを取得し、低周波帯域信号の量子化パラメータに従って高周波帯域信号の励振信号を予測し、次いで高周波帯域信号の周波数エンベロープおよび高周波帯域信号の励振信号に従って高周波帯域信号を予測する。この実施形態での技術的解決策を利用することにより、予測プロセスに過剰ノイズがもたらされることが回避され、予測によって取得される高周波帯域信号と実高周波帯域信号との間の誤差が効果的に縮小され、予測される高周波帯域信号の精度が上昇し得る。
同様におよび任意には、前述の実施形態の技術的解決策においては、201で、符号化デバイスは、高周波帯域信号の周波数エンベロープを取得するために信号タイプに従って高周波帯域信号の周波数エンベロープを符号化する。たとえば、信号タイプが非調波信号である場合には、第1の量のスペクトル係数が高周波帯域信号の周波数エンベロープを計算するために使用され、信号タイプが調波信号である場合には、第2の量のスペクトル係数が高周波帯域信号の周波数エンベロープを計算するために使用される。ここで、第2の量は、第1の量よりも大きい。このようにすることで、高周波帯域信号のものであり信号タイプが調波信号である場合に符号化デバイスにより符号化されることによって取得される周波数エンベロープによって対応されるサブバンドの幅は、高周波帯域信号のものであり信号タイプが非調波信号である場合に符号化デバイスにより符号化されることによって取得される周波数エンベロープによって対応されるサブバンドの幅よりも大きい。特定の一実装プロセスの詳細については、図3および図3に示す実施形態の前述の拡張実施形態中の記載を参照されたい。本明細書では詳細については再度説明しない。
図5は、本発明のさらに別の実施形態による高周波帯域信号を予測するための方法の流れ図である。この実施形態では、高周波帯域信号を予測するための方法は、符号化デバイスによって実行され得る。図5に示すように、この実施形態では、高周波帯域信号を予測するための方法は、具体的には以下のステップを含み得る。
300.符号化デバイスが、音声信号の信号タイプと音声信号の低周波帯域信号とを取得する。
この実施形態では、信号タイプは、調波信号または非調波信号であり、音声信号は、低周波帯域信号および高周波帯域信号を含む。
301.符号化デバイスは、高周波帯域信号の周波数エンベロープを計算する。
この実施形態では、調波信号の高周波帯域信号の周波数エンベロープを計算するための方法が、非調波信号の高周波帯域信号の周波数エンベロープを計算するための方法と同一である。
302.符号化デバイスが、信号タイプと、低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達するビットストリームを復号デバイスに送る。
同様に、この実施形態では、本発明の実施形態における技術的解決策が、符号化デバイスの側において説明され、この実施形態では、ビットストリームは、信号タイプと、低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達する。
これに対応して、復号デバイスの側では、復号デバイスは、ビットストリームを受領し、信号タイプおよび低周波帯域信号を取得するために受領したビットストリームを逆多重化し、次いで、信号タイプに従って高周波帯域信号の周波数エンベロープを取得する。たとえば、信号タイプが非調波信号である場合には、復号デバイスは、受領したビットストリームを逆多重化し、高周波帯域信号の周波数エンベロープを取得するために受領したビットストリームを復号し、信号タイプが調波信号である場合には、復号デバイスは、受領したビットストリームを逆多重化し、高周波帯域信号の初期周波数エンベロープを取得するために受領したビットストリームを復号し、初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープに加重計算を実施することによって取得される値を高周波帯域信号の周波数エンベロープとして使用する。ここで、Nは1以上である。次いで、復号デバイスは、低周波帯域信号に従って高周波帯域信号の励振信号を予測し、高周波帯域信号の周波数エンベロープおよび高周波帯域信号の励振信号に従って高周波帯域信号を復元する。具体的には、この実施形態は、図3に示す実施形態の前述の拡張実施形態における他の場合に対応している。具体的な一実装プロセスの詳細については、図3および図3に示す実施形態の前述の拡張実施形態における関連記載を参照されたい。本明細書では詳細については再度説明しない。
この実施形態における高周波帯域信号を予測するための方法によれば、符号化デバイスは、音声信号の信号タイプと、音声信号の低周波帯域信号とを取得し、高周波帯域信号の周波数エンベロープを計算し、信号タイプと、低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達するビットストリームを復号デバイスに送り、それにより復号デバイスは、信号タイプおよび低周波帯域信号を取得するためにビットストリームを逆多重化し、次いで信号タイプに従って高周波帯域信号の周波数エンベロープを取得し、次いで低周波帯域信号に従って高周波帯域信号の励振信号を予測し、高周波帯域信号の周波数エンベロープおよび高周波帯域信号の励振信号に従って高周波帯域信号を復元する。この実施形態での技術的解決策を利用することにより、予測プロセスに過剰ノイズがもたらされることが回避され、予測によって取得される高周波帯域信号と実高周波帯域信号との間の誤差が効果的に縮小され、予測される高周波帯域信号の精度が上昇し得る。
前述の方法実施形態のステップのすべてまたは一部が、関連ハードウェアに命令するプログラムによって実装されてもよいことが当業者には理解されよう。このプログラムは、コンピュータ可読記憶媒体に格納されてもよい。プログラムが実行されると、方法実施形態のステップが実施される。前述の記憶媒体は、ROM、RAM、磁気ディスク、または光ディスクなどの、プログラムコードを格納し得る任意の媒体を含む。
図6は、本発明の一実施形態による復号デバイスの概略構造図である。図6に示すように、この実施形態では、復号デバイスは、第1の取得モジュール30、第2の取得モジュール31、予測モジュール32、および復元モジュール33を備える。
第1の取得モジュール30は、音声信号の信号タイプと音声信号の低周波帯域信号とを取得するように構成される。信号タイプは、調波信号または非調波信号であり、音声信号は、低周波帯域信号および高周波帯域信号を含む。第2の取得モジュール31は、第1の取得モジュール30に接続され、第2の取得モジュール31は、第1の取得モジュール30により取得される信号タイプに従って高周波帯域信号の周波数エンベロープを取得するように構成される。予測モジュール32は、第1の取得モジュール30に接続され、予測モジュール32は、第1の取得モジュール30により取得される低周波帯域信号に従って高周波帯域信号の励振信号を予測するように構成される。復元モジュール33は、第2の取得モジュール31および予測モジュール32に個別に接続され、復元モジュール33は、高周波帯域信号のものであり第2の取得モジュール31により取得される周波数エンベロープと、高周波帯域信号のものであり予測モジュール32により予測されることによって取得される励振信号とに従って高周波帯域信号を復元するように構成される。
この実施形態における復号デバイスは、前述の関連する方法実施形態の実装プロセスと同一である高周波帯域信号の予測を実装するために前述のモジュールを使用する。詳細については、前述の関連する方法実施形態中の記載を参照されたい。本明細書では詳細については再度説明しない。
この実施形態における復号デバイスは、異なるタイプの信号について、異なるスペクトル係数がエンベロープを復号するために使用されることを実装するために前述のモジュールを使用し、それにより低周波帯域信号に従って予測される高周波帯域調波信号の励振信号が、最初の調波特性を維持することが可能となり、それにより予測プロセスに過剰ノイズがもたらされるのを回避し、予測によって取得される高周波帯域信号と実高周波帯域信号との間に存在する誤差を効果的に縮小し、予測される高周波帯域信号の精度を上昇させる。
図7は、本発明の別の実施形態による復号デバイスの概略構造図である。この実施形態では、図6に示す前述の実施形態に基づき、復号デバイスは以下の拡張技術解決策をさらに含み得る。
この実施形態における復号デバイスは、具体的には、第2の取得モジュール31は、第1の取得モジュール30により取得される信号タイプが非調波信号である場合には、受領したビットストリームを逆多重化し、高周波帯域信号の周波数エンベロープを取得するために受領したビットストリームを復号するように構成される。または、第2の取得モジュール31は、具体的には、第1の取得モジュール30により取得される信号タイプが調波信号である場合には、受領したビットストリームを逆多重化し、高周波帯域信号の初期周波数エンベロープを取得するために受領したビットストリームを復号し、初期周波数エンベロープおよびN個の隣接し合う初期周波数エンベロープに加重計算を実施することによって取得される値を高周波帯域信号の周波数エンベロープとしてさらに使用するように構成される。ここで、Nは1以上である。
任意には、この実施形態における復号デバイスで、第2の取得モジュール31は、具体的には、高周波帯域信号の対応する周波数エンベロープを取得するために、第1の取得モジュール30により取得される信号タイプに従って受領したビットストリームを復号するように構成される。
任意には、この実施形態における復号デバイスで、第1の取得モジュール30は、具体的には信号タイプおよび低周波帯域信号を取得するためにビットストリームを逆多重化するように構成される。この場合では、これに対応して、符号化デバイスにより送られ復号デバイスにより受領されるビットストリームは、信号タイプと、低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達する。
任意には、この実施形態における復号デバイスで、第1の取得モジュール30は、低周波帯域信号を取得するためにビットストリームを逆多重化するよう特に構成され、低周波帯域信号に従って信号タイプを決定する。
任意には、この実施形態における復号デバイスで、予測モジュール32は、具体的には決定ユニット321、判断ユニット322、第1の処理ユニット323、および第2の処理ユニット324を備えてもよい。
決定ユニット321は、第1の取得モジュール30に接続され、決定ユニット321は、第1の取得モジュール30により取得された低周波帯域信号のビットが割り当てられる最も高い周波数ビンを決定するように構成される。判断ユニット322は、決定ユニット321に接続され、判断ユニット322は、低周波帯域信号の、ビットが割り当てられるおよび決定ユニット321により決定される最も高い周波数ビンが、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満であるか否かを判定するように構成される。第1の処理ユニット323は、判断ユニット322に接続され、第1の処理ユニット323は、判断ユニット322が、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満であると判定した場合に、所定の周波数帯域範囲内に含まれ低周波帯域信号および高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン中の励振信号に従って高周波帯域信号の励振信号を予測する。また、第2の処理ユニット324は、判断ユニット322に接続され、第2の処理ユニット324は、判断ユニット322が、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン以上である場合に、所定の周波数帯域範囲内に含まれる、ならびに低周波帯域信号、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン、および低周波帯域信号のビットが割り当てられる最も高い周波数ビンの中の励振信号に従って、高周波帯域信号の励振信号を予測するように構成される。この場合には、これに対応して、復元モジュール33が、第2の取得モジュール31、第1の処理ユニット323、および第2の処理ユニット324に個別に接続される。しかしながら、同時に、復元モジュール33は、第1の処理ユニット323および第2の処理ユニット324のいずれかのみに接続され得る。判断ユニット322が、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満であると判定した場合には、復元モジュール33は、第1の処理ユニット323に接続される。判断ユニット322が、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始
周波数ビン以上であると判定した場合には、復元モジュール33は、第2の処理ユニット324に接続される。復元モジュール33は、具体的には、高周波帯域信号のものであり第2の取得モジュール31により取得される周波数エンベロープと、高周波帯域信号のものであり第1の処理ユニット323または第2の処理ユニット324による予測によって取得される励振信号とに従って高周波帯域信号を復元するように構成される。
さらに任意には、この実施形態における復号デバイスで、第1の処理ユニット323は、具体的には、判断ユニット322が、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満であると判定した場合に、所定位の周波数帯域範囲内の励振信号のn個のコピーを作製し、この励振信号のn個のコピーを高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するように構成される。ここで、nは、正の整数または正の小数であり、nは、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の周波数ビンの量の、所定の周波数帯域範囲内の周波数ビンの量に対する比に等しい。第1の処理ユニット323の特定の実装形態については、図3に示す実施形態の前述の拡張実施形態中に記載される技術的解決策が利用されてもよい。本明細書では詳細については再度説明しない。
さらに任意には、この実施形態における復号デバイスで、第2の処理ユニット324は、具体的には、判断ユニット322が、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン以上であると判定した場合に、所定の周波数帯域範囲の開始周波数ビンfexc_startを超える第mの周波数ビンから所定の周波数帯域範囲の終了周波数ビンfexc_endまで励振信号をコピーし、所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、この励振信号の2つの部分を低周波帯域信号のビットが割り当てられる最も高い周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するように構成される。ここで、nは、0、正の整数、または正の小数であり、mは、低周波帯域信号のビットが割り当てられる最も高い周波数ビンと拡張周波数帯域のプリセット開始周波数ビンとの間の周波数ビンの量である。第2の処理ユニット324の特定の実装形態については、図3に示す実施形態の前述の拡張実施形態中に異彩される技術的解決策が利用されてもよい。本明細書では詳細については再度説明しない。
この実施形態における復号デバイスによれば、前述の複数の任意の実施形態と共存する様式が、本発明における技術的解決策を導入するために使用される。実際の参照では、前述の複数の任意の実施形態は、本発明の実施形態を形成するためにランダムに組み合わされ得る。本明細書では詳細については再度説明しない。
この実施形態における復号デバイスは、前述の関連する方法実施形態の実装プロセスと同一である高周波帯域信号の予測を実装するために前述のモジュールを使用する。詳細については、前述の関連する方法実施形態中の記載を参照されたい。本明細書では詳細については再度説明しない。
この実施形態における復号デバイスは、エンベロープを復号するために異なるタイプの信号について異なるスペクトル係数を使用するために前述のモジュールを使用し、それにより低周波帯域信号に従って予測される高周波帯域調波信号の励振信号が、最初の調波特性を維持することが可能となり、それにより予測プロセスに過剰ノイズがもたらされるのを回避し、予測によって取得される高周波帯域信号と実高周波帯域信号との間に存在する誤差を効果的に縮小し、予測される高周波帯域信号の精度を上昇させる。
図8は、本発明の一実施形態による符号化デバイスの概略構造図である。図8に示すように、この実施形態では、符号化デバイスは、具体的には取得モジュール40、符号化モジュール41、および送りモジュール42を備え得る。
取得モジュール40は、音声信号の信号タイプと音声信号の低周波帯域信号とを取得するように構成される。信号タイプは、調波信号または非調波信号であり、音声信号は、低周波帯域信号および高周波帯域信号を含む。符号化モジュール41は、取得モジュール40に接続され、符号化モジュール41は、高周波帯域信号の周波数エンベロープを取得するために、取得モジュール40により取得される信号タイプに従って高周波帯域信号の周波数エンベロープを符号化するように構成される。送りモジュール42は、取得モジュール40および符号化モジュール41に個別に接続され、送りモジュール42は、取得モジュール40により取得された信号タイプと、取得モジュール40により取得された低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達し、符号化モジュール41により符号化されることによって取得されるビットストリームを復号デバイスに送るように構成される。
たとえば、前述のモジュールを使用することによって、符号化デバイスは、信号タイプと、低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達するビットストリームを復号デバイスに送ってもよく、それにより復号デバイスは、音声信号の信号タイプと音声信号の低周波帯域信号とを取得し、ここで信号タイプは、調波信号または非調波信号であり、音声信号は、低周波帯域信号および高周波帯域信号を含み、さらに復号デバイスは、信号タイプに従って高周波帯域信号の周波数エンベロープを取得し、低周波帯域信号に従って高周波帯域信号の励振信号を予測し、高周波帯域信号の周波数エンベロープおよび高周波帯域信号の励振信号に従って高周波帯域信号を復元する。詳細については、前述の関連実施形態中の記載を参照されたい。本明細書では詳細については再度説明しない。
この実施形態における符号化デバイスは、前述の関連する方法実施形態の実装プロセスと同一である高周波帯域信号の予測を実装するために前述のモジュールを使用する。詳細については、前述の関連する方法実施形態中の記載を参照されたい。本明細書では詳細については再度説明しない。
前述のモジュールを使用することによって、この実施形態における符号化デバイスは、異なるタイプの信号について、異なるスペクトル係数がエンベロープを復号するために使用されることを従来的に実装することが可能であり、それにより、低周波帯域信号に従って予測される高周波帯域調波信号の励振信号が、最初の調波特性を維持することが可能となり、それにより予測プロセスに過剰ノイズがもたらされるのを回避し、予測によって取得される高周波帯域信号と実高周波帯域信号との間に存在する誤差を効果的に縮小し、予測される高周波帯域信号の精度を上昇させる。
任意には、図8に示す前述の実施形態に基づき、符号化モジュール41は、具体的には、取得モジュール40により取得される信号タイプが非調波信号である場合には、第1の量のスペクトル係数が高周波帯域信号の周波数エンベロープを計算するために使用されるように構成される。または、符号化モジュール41は、具体的には、取得モジュール40により取得される信号タイプが調波信号である場合には、第2の量のスペクトル係数が高周波帯域信号の周波数エンベロープを計算するために使用されるように構成される。ここで、前記第2の量は前記第1の量よりも大きい。
図9は、本発明の別の実施形態による符号化デバイスの概略構造図である。図9に示すように、この実施形態では、符号化デバイスは、具体的には取得モジュール50、計算モジュール51、および送りモジュール52を備え得る。
取得モジュール50は、音声信号の信号タイプと音声信号の低周波帯域信号とを取得するように構成される。信号タイプは、調波信号または非調波信号であり、音声信号は、低周波帯域信号および高周波帯域信号を含む。計算モジュール51は、高周波帯域信号の周波数エンベロープを計算するように構成され、調波信号の高周波帯域信号の周波数エンベロープを計算するための方法が、非調波信号の高周波帯域信号の周波数エンベロープを計算するための方法と同一である。送りモジュール52は、取得モジュール50および計算モジュール51に個別に接続され、送りモジュール52は、取得モジュール50により取得される信号タイプと、取得モジュール50により取得される低周波帯域信号の符号化インデックスおよび高周波帯域信号のものであり計算モジュール51による計算によって取得される周波数エンベロープの符号化インデックスとを伝達するビットストリームを復号デバイスに送るように構成される。
たとえば、前述のモジュールを使用することによって、符号化デバイスは、信号タイプと、低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達するビットストリームを復号デバイスに送ってもよく、それにより復号デバイスは、音声信号の信号タイプと音声信号の低周波帯域信号とを取得し、ここで信号タイプは、調波信号または非調波信号であり、音声信号は、低周波帯域信号および高周波帯域信号を含み、さらに復号デバイスは、信号タイプに従って高周波帯域信号の周波数エンベロープを取得し、低周波帯域信号に従って高周波帯域信号の励振信号を予測し、高周波帯域信号の周波数エンベロープおよび高周波帯域信号の励振信号に従って高周波帯域信号を復元する。詳細については、前述の関連実施形態中の記載を参照されたい。本明細書では詳細については再度説明しない。
この実施形態における符号化デバイスは、前述の関連する方法実施形態の実装プロセスと同一である高周波帯域信号の予測を実装するために前述のモジュールを使用する。詳細については、前述の関連実施形態中の記載を参照されたい。本明細書では詳細については再度説明しない。
前述のモジュールを使用することによって、この実施形態における符号化デバイスは、異なるタイプの信号について、異なるスペクトル係数がエンベロープを復号するために使用されることを従来的に実装することが可能であり、それにより、低周波帯域信号に従って予測される高周波帯域調波信号の励振信号が、最初の調波特性を維持することが可能となり、それにより予測プロセスに過剰ノイズがもたらされるのを回避し、予測によって取得される高周波帯域信号と実高周波帯域信号との間に存在する誤差を効果的に縮小し、予測される高周波帯域信号の精度を上昇させる。
図10は、本発明の一実施形態による符号化デバイスの一例の図である。図10に示すように、この実施形態では、符号化デバイスは、図1に示す前述の既存の符号化デバイスに本発明の実施形態での技術的解決策を付加することによって形成された符号化デバイスの一例の図である。図10に示すように、先行技術における図1に示す符号化デバイスに基づき、この実施形態では、分類抽出/符号化モジュール17が、符号化デバイスに付加される。
分類抽出/符号化モジュール17は、時間-周波数変換モジュール10に接続され、分類抽出/符号化モジュール17は、時間-周波数変換モジュール10による変換後に取得される信号タイプを取得し、高周波帯域信号のものでありエンベロープ量子化/符号化モジュール12により量子化される周波数エンベロープを符号化するように構成される。本明細書では、信号タイプは、調波信号または非調波信号であり得る。分類抽出/符号化モジュール17は、多重化モジュール16にさらに接続され、この場合には、多重化モジュール16は、分類抽出/符号化モジュール17により取得される信号タイプと、信号タイプに従って高周波帯域信号の周波数エンベロープを符号化することによって取得される符号化インデックスと、励振量子化/符号化モジュール15により量子化される励振信号とをビットストリームに個別に多重化し、復号デバイスにこのビットストリームを出力するように構成される。他は、図1に示す前述の実施形態のものと同一である。詳細については、前述の関連実施形態中の記載を参照されたい。本明細書では詳細については再度説明しない。
この実施形態での符号化デバイスの技術的解決策の特定の実装形態については、図1、図4、および図6に示す前述の実施形態中の記載を参照されたい。本明細書では詳細については再度説明しない。
この実施形態における符号化デバイスは、調波信号および非調波信号に関する異なるエンベロープ情報を取得し、復号デバイスにこのエンベロープ情報を送るために前述の技術的解決策を利用し、それにより復号デバイスは、高周波帯域信号の予測された励振信号を修正するために調波信号および非調波信号について異なるエンベロープ情報を使用するため、これにより、修正プロセスに過剰ノイズがもたらされるのを回避し、修正によって取得される高周波帯域信号と実高周波帯域信号との間に存在する誤差を効果的に縮小し、予測される高周波帯域信号の精度を上昇させる。
任意には、図10に示す前述の実施形態で、計算モジュールがさらに付加されてもよい。計算モジュールは、高周波帯域信号の周波数エンベロープを計算するように構成され、調波信号の高周波帯域信号の周波数エンベロープを計算するための方法は、非調波信号の高周波帯域信号の周波数エンベロープを計算するための方法と同一である。この場合には、分類抽出/符号化モジュール17は、高周波帯域信号のものでありエンベロープ量子化/符号化モジュール12により量子化される周波数エンベロープを信号タイプに従って符号化しない。エンベロープ量子化/符号化の実装は、図10に示す前述の実施形態における実装と同一である。この実施形態での符号化デバイスの技術的解決策の特定の実装については、図1、図5、および図7に示す前述の実施形態中の記載を参照されたい。本明細書では詳細については再度説明しない。
図11は、本発明の一実施形態による復号デバイスの一例の図である。図11に示すように、この実施形態では、復号デバイスは、図2に示す前述の既存の復号デバイスに本発明の実施形態での技術的解決策を付加することによって形成された復号デバイスの一例の図である。図11に示すように、先行技術における図2に示す復号デバイスに基づき、この実施形態では、分類情報復号モジュール27が、復号デバイスに付加される。
分類情報復号モジュール27は、受領したビットストリームから信号タイプを取得するように構成される。周波数領域信号復元モジュール25は、分類情報復号モジュール27にさらに接続され、周波数領域信号復元モジュール25は、分類情報復号モジュール27により取得される信号タイプと、周波数エンベロープ復号モジュール21により取得される周波数エンベロープと、全周波数帯域のものであり帯域幅拡張モジュール24により取得される励振信号とに従って周波数領域信号を復元する。
一方で、この実施形態では、励振信号復号モジュール23により取得される励振信号に従って帯域幅拡張モジュール24により全帯域幅を拡張するために、すなわち低周波帯域信号の励振信号を使用することによって高周波帯域信号の励振信号を拡張するために、低周波帯域信号に従って高周波帯域信号の励振信号を予測するためのものであり、図3に示す実施形態の前述の拡張実施形態に記載される方法が利用されてもよい。詳細については、前述の関連実施形態中の記載を参照されたい。本明細書では詳細については再度説明しない。
前述の解決策を利用することによって、この実施形態における復号デバイスは、高周波帯域信号のものであり前者のフレームおよび後者のフレーム中で予測される励振信号の連続性を効果的に確保することが可能となる一方で、調波信号および非調波信号については、高周波帯域信号の予測される励振信号を修正するために異なるエンベロープ情報を使用することが可能となり、それにより予測プロセスに過剰ノイズがもたらされるのを回避し、予測によって取得される高周波帯域信号と実高周波帯域信号との間に存在する誤差を効果的に縮小し、予測される高周波帯域信号の精度を上昇させる。
図10に示す前述の実施形態における符号化デバイスおよび図11に示す前述の実施形態における復号デバイスは、本発明のオプション例の構造にすぎない。実際の適用では、本発明のさらなるオプション例の構造が、図3〜図9に示す前述の実施形態の技術的解決策に従ってさらに推測され得る。詳細については、前述の実施形態中の記載を参照されたい。本明細書では詳細については再度説明しない。
図12は、本発明の一実施形態による高周波帯域信号を予測するためのシステムの概略構造図である。この実施形態では、高周波帯域信号を予測するためのシステムは、符号化デバイス70および復号デバイス80を含む。
この実施形態では、復号デバイス80は、図6または図7に示す前述の実施形態における復号デバイスであってもよい。符号化デバイス70は、先行技術の符号化デバイス化、または図8もしくは図9に示す前述の実施形態における符号化デバイスであってもよい。
この実施形態で高周波帯域信号を予測するためのシステムでは、符号化デバイス70および復号デバイス80を使用することによって高周波帯域信号を予測する特定の一実装プロセスの詳細については、図6、図7、図8、または図9に示す前述の実施形態と、関連する方法実施形態との中の記載を参照されたい。本明細書では詳細については再度説明しない。
この実施形態で高周波帯域信号を予測するためのシステムによれば、前述の技術的解決策を利用することによって、調波信号および非調波信号について、異なるエンベロープ情報が、高周波帯域信号の励振信号を予測するために使用され、それにより修正プロセスに過剰ノイズがもたらされるのを回避し、修正によって取得される高周波帯域信号と実高周波帯域信号との間に存在する誤差を効果的に縮小し、予測される高周波帯域信号の精度を上昇させる。さらに、図7に示す実施形態における復号デバイスが、高周波帯域信号を予測するためのシステムで使用される場合には、高周波帯域信号のものであり前者のフレームおよび後者のフレーム中で予測される励振信号の連続性が、さらに効果的に確保され得るため、それにより復元された高周波帯域信号の聴覚的品質が確保され、音声信号の聴覚的品質が向上する。
図13は、本発明の別の実施形態による装置90のブロック図である。図13の装置90は、前述の方法実施形態においてステップおよび方法を実装するために使用され得る。装置90は、様々な通信システムで基地局または端末に適用され得る。図13の実施形態では、装置90は、受信回路902、復号プロセッサ903、処理ユニット904、メモリ905、およびアンテナ901を備える。処理ユニット904は、装置90の動作を制御し、処理ユニット904は、CPU(Central Processing Unit、中央処理装置)とも呼ばれる場合がある。メモリ905は、リードオンリーメモリおよびランダムアクセスメモリを備えてもよく、処理ユニット904に命令およびデータを供給する。メモリ905の一部は、不揮発性ランダムアクセスメモリ(NVRAM)をさらに備えてもよい。具体的な一適用では、携帯電話などのワイヤレス通信デバイスが、装置90に組み込まれてもよく、または装置90が、ワイヤレス通信デバイスであってもよく、装置90は、装置90が遠隔位置からデータを受信することが可能になるように受信回路902を収容するキャリアをさらに備えてもよい。受信回路902は、アンテナ901に結合され得る。装置90のすべての構成要素が、バスシステム906を使用することによって共に結合され、バスシステム906は、データバスに加えて、電力バス、制御バス、およびステータス信号バスをさらに備える。しかしながら、説明の明瞭化のために、様々なバスが、図13ではバスシステム906として記される。装置90は、信号を処理するように構成された処理ユニット904をさらに備えてもよく、加えて復号プロセッサ903をさらに備える。
本発明の前述の実施形態で開示される方法は、復号プロセッサ903に適用されてもよく、または復号プロセッサ903によって実装されてもよい。復号プロセッサ903は、集積回路チップであってもよく、信号処理能力を有する。一実装プロセスでは、前述の方法実施形態(たとえば図3に対応する方法実施形態)におけるステップが、復号プロセッサ903中のハードウェアの集積論理回路またはソフトウェアの形態の命令を使用することによって完遂されてもよい。これらの命令は、処理ユニット904と共に協働することによって実装および制御され得る。前述の復号プロセッサは、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)もしくは別のプログラマブル論理構成要素、個別ゲートもしくはトランジスタ論理構成要素、または個別ハードウェア構成要素であってもよい。本発明の実施形態で開示される方法、ステップ、および論理ブロック図は、実装または実施され得る。汎用プロセッサは、マイクロプロセッサであってもよく、またはプロセッサは、任意の従来のプロセッサ、トランジスタ、もしくは同様のものであってもよい。本発明の実施形態を参照として開示される方法のステップは、ハードウェアとして具現化される復号プロセッサにより直接的に実行および完遂されてもよく、または復号プロセッサ中のハードウェアモジュールおよびソフトウェアモジュールの組合せを使用することによって実行および完遂されてもよい。ソフトウェアモジュールは、ランダムアクセスメモリ、フラッシュメモリ、リードオンリーメモリ、プログラマブルリードオンリーメモリ、電気的消去可能プログラマブルリードオンリーメモリ、またはレジスタなどの、当技術で成熟した記憶媒体内に配置されてもよい。記憶媒体は、メモリ905内に配置されてもよい。復号プロセッサ903は、メモリ905から情報を読み出し、ハードウェアとの組合せで前述の方法のステップを完遂する。
たとえば、図6または図7の信号復号デバイスは、復号プロセッサ903によって実装されてもよい。さらに、図6では、第1の取得モジュール30、第2の取得モジュール31、予測モジュール32、および復元モジュール33は、処理ユニット904により実装されてもよく、または復号プロセッサ903により実装されてもよい。同様に、図7の各モジュールは、処理ユニット904により実装されてもよく、復号プロセッサ903により実装されてもよい。しかしながら、前述の例は、もっぱら例示にすぎず、この特定の実装様式に本発明の実施形態を限定するようには意図されない。
具体的には、メモリ905は、処理ユニット904または復号プロセッサ903が以下の動作を、すなわち、音声信号の信号タイプおよび音声信号の低周波帯域信号を取得することであって、音声信号は低周波帯域信号および高周波帯域信号を含む、取得することと、信号タイプに従って高周波帯域信号の周波数エンベロープを取得することと、低周波帯域信号に従って高周波帯域信号の励振信号を予測することと、高周波帯域信号の周波数エンベロープおよび高周波帯域信号の励振信号に従って高周波帯域信号を復元することとを実装することを可能にする命令を格納する。
図14は、本発明の別の実施形態による装置100のブロック図である。図14の装置100は、前述の方法実施形態でステップおよび方法を実装するために使用され得る。装置100は、様々な通信システムで基地局または端末に適用され得る。図14の実施形態では、装置100は、受信回路1002、符号化プロセッサ1003、処理ユニット1004、メモリ1005、およびアンテナ1001を備える。処理ユニット1004は、装置100の動作を制御し、処理ユニット1004は、CPU(Central Processing Unit、中央処理装置)とも呼ばれる場合がある。メモリ1005は、リードオンリーメモリおよびランダムアクセスメモリを備えてもよく、処理ユニット1004に命令およびデータを供給する。メモリ1005の一部は、不揮発性ランダムアクセスメモリ(NVRAM)をさらに備えてもよい。具体的な一適用では、携帯電話などのワイヤレス通信デバイスが、装置100に組み込まれてもよく、または装置100が、ワイヤレス通信デバイスであってもよく、装置100は、装置100が遠隔位置からデータを受信することが可能になるように受信回路1002を収容するキャリアをさらに備えてもよい。受信回路1002は、アンテナ1001に結合され得る。装置100のすべての構成要素が、バスシステム1006を使用することによって共に結合され、バスシステム1006は、データバスに加えて、電力バス、制御バス、およびステータス信号バスをさらに備える。しかしながら、説明の明瞭化のために、様々なバスが、図14ではバスシステム1006として記される。装置100は、信号を処理するように構成された処理ユニット1004をさらに備えてもよく、加えて符号化プロセッサ1003をさらに備える。
本発明の前述の実施形態で開示される方法は、符号化プロセッサ1003に適用されてもよく、または符号化プロセッサ1003によって実装されてもよい。符号化プロセッサ1003は、集積回路チップであってもよく、信号処理能力を有する。一実装プロセスでは、前述の方法実施形態(たとえば図4または図5に対応する方法実施形態)におけるステップが、符号化プロセッサ1003中のハードウェアの集積論理回路またはソフトウェアの形態の命令を使用することによって完遂されてもよい。これらの命令は、処理ユニット1004と共に協働することによって実装および制御され得る。前述の符号化プロセッサは、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)もしくは別のプログラマブル論理構成要素、個別ゲートもしくはトランジスタ論理構成要素、または個別ハードウェア構成要素であってもよい。本発明の実施形態で開示される方法、ステップ、および論理ブロック図は、実装または実施され得る。汎用プロセッサは、マイクロプロセッサであってもよく、またはプロセッサは、任意の従来のプロセッサ、トランジスタ、もしくは同様のものであってもよい。本発明の実施形態を参照として開示される方法のステップは、ハードウェアとして具現化される復号プロセッサにより直接的に実行および完遂されてもよく、または復号プロセッサ中のハードウェアモジュールおよびソフトウェアモジュールの組合せを使用することによって実行および完遂されてもよい。ソフトウェアモジュールは、ランダムアクセスメモリ、フラッシュメモリ、リードオンリーメモリ、プログラマブルリードオンリーメモリ、電気的消去可能プログラマブルリードオンリーメモリ、またはレジスタなどの、当技術で成熟した記憶媒体内に配置されてもよい。記憶媒体は、メモリ1005内に配置されてもよい。符号化プロセッサ1003は、メモリ1005から情報を読み出し、ハードウェアとの組合せで前述の方法のステップを完遂する。
たとえば、図8または図9の信号符号化デバイスは、符号化プロセッサ1003により実装されてもよい。さらに、図8では、取得モジュール40、符号化モジュール41、および送りモジュール42は、処理ユニット1004により実装されてもよく、または符号化プロセッサ1003により実装されてもよい。同様に、図9の各モジュールは、処理ユニット1004により実装されてもよく、または符号化プロセッサ1003により実装されてもよい。しかしながら、前述の例は、もっぱら例示にすぎず、この特定の実装様式に本発明の実施形態を限定するようには意図されない。
具体的には、メモリ1005のストレージにより、処理ユニット1004または符号化プロセッサ1003は、以下の動作に関する、すなわち音声信号の信号タイプおよび音声信号の低周波帯域信号を取得することであって、音声信号は低周波帯域信号および高周波帯域信号を含む、取得することと、高周波帯域信号の周波数エンベロープを取得するために信号タイプに従って高周波帯域信号の周波数エンベロープを符号化することと、信号タイプと低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達するビットストリームを復号デバイスに送ることとに関する命令を実装することが可能となる。
具体的には、メモリ1005のストレージにより、処理ユニット1004または符号化プロセッサ1003は、以下の動作に関する、すなわち音声信号の信号タイプおよび音声信号の低周波帯域信号を取得することであって、信号タイプは調波信号または非調波信号であり、音声信号は低周波帯域信号および高周波帯域信号を含む、取得することと、高周波帯域信号の周波数エンベロープを計算することであって、調波信号の高周波帯域信号の周波数エンベロープを計算するための方法は非調波信号の高周波帯域信号の周波数エンベロープを計算するための方法と同一である、計算することと、信号タイプと低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達するビットストリームを復号デバイスに送ることとに関する命令を実装することが可能となる。
説明される装置実施形態は、例示にすぎない。個別のパーツとして説明されるユニットは、物理的に独立したものであってもよくまたはそうでなくてもよく、ユニットとして示されるパーツは、物理的なユニットであってもよくそうでなくてもよく、1つの位置に位置してもよく、または少なくとも2つのネットワークユニット上で分散されてもよい。モジュールの一部またはすべてが、実施形態の解決策の目標を達成するために実際のニーズに従って選択されてもよい。創造的努力を伴うことなく本発明の実施形態が当業者には理解および実装されよう。
最後に、前述の実施形態は、本発明の技術的解決策について説明するために意図されたものにすぎず、本発明を限定することを意図されたものではない点に留意されたい。本発明は、前述の実施形態を参照として詳細に説明されたが、本発明の実施形態の技術的解決策の主旨および範囲から逸脱することなく、前述の実施形態において説明された技術的解決策に対して修正を依然として行い得る点を、または本発明の技術的特徴に均等な置換を行い得る点を当業者には理解されたい。
10 時間-周波数変換モジュール
11 エンベロープ抽出モジュール
12 エンベロープ量子化/符号化モジュール
13 ビット割当てモジュール
14 励振発生モジュール
15 励振量子化/符号化モジュール
16 多重化モジュール
17 分類抽出/符号化モジュール
20 逆多重化モジュール
21 周波数エンベロープ復号モジュール
22 ビット割当て取得モジュール
23 励振信号復号モジュール
24 帯域幅拡張モジュール
25 周波数領域信号復元モジュール
26 周波数-時間変換モジュール
27 分類情報復号モジュール
30 第1の取得モジュール
31 第2の取得モジュール
32 予測モジュール
33 復元モジュール
321 決定ユニット
322 判断ユニット
323 第1の処理ユニット
324 第2の処理ユニット
40 取得モジュール
41 符号化モジュール
42 送りモジュール
50 取得モジュール
51 計算モジュール
52 送りモジュール
70 符号化デバイス
80 復号デバイス
90 装置
901 アンテナ
902 受信回路
903 復号プロセッサ
904 処理ユニット
905 メモリ
906 バスシステム
100 装置
1001 アンテナ
1002 受信回路
1003 符号化プロセッサ
1004 処理ユニット
1005 メモリ
1006 バスシステム

Claims (17)

  1. 高周波帯域信号を予測するための方法であって、
    復号すべき音声信号の信号タイプおよび前記音声信号の低周波帯域信号を取得するステップであって、前記音声信号の高周波帯域信号の信号タイプは調波または非調波である、ステップと、
    前記信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを取得するステップと
    前記音声信号の前記低周波帯域信号に従って前記音声信号の前記高周波帯域信号の励振信号を予測するステップと、
    前記高周波帯域信号の前記周波数エンベロープおよび前記高周波帯域信号の前記励振信号に従って前記音声信号の前記高周波帯域信号を復元するステップと
    を含み、
    前記信号タイプが非調波である場合に、前記信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを取得する前記ステップは、
    前記音声信号の前記高周波帯域信号の前記周波数エンベロープを取得するために前記音声信号の受領したビットストリームを復号するステップを含み、かつ
    前記信号タイプが調波である場合に、前記信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを取得する前記ステップは、
    前記音声信号の前記高周波帯域信号の初期周波数エンベロープを取得するために前記音声信号の受領したビットストリームを復号し、前記初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープに加重計算を実施することによって取得される値を前記高周波帯域信号の前記周波数エンベロープとして使用するステップであって、Nは1以上である、ステップを含む、
    方法。
  2. 復号すべき音声信号の信号タイプおよび前記音声信号の低周波帯域信号を取得する前記ステップは、
    前記信号タイプおよび前記低周波帯域信号を取得するために前記音声信号の受領したビットストリームを復号するステップであって、前記信号タイプは、調波信号または非調波信号である、ステップ
    を含む、請求項1に記載の方法。
  3. 復号すべき音声信号の信号タイプおよび前記音声信号の低周波帯域信号を取得する前記ステップは、
    前記音声信号の前記低周波帯域信号を取得するために前記音声信号の受領したビットストリームを復号するステップと、
    前記低周波帯域信号に従って前記信号タイプを決定するステップであって、前記信号タイプは調波信号または非調波信号である、ステップと
    を含む、請求項1に記載の方法。
  4. 前記音声信号の前記低周波帯域信号に従って前記音声信号の前記高周波帯域信号の励振信号を予測する前記ステップは、
    前記低周波帯域信号のビットが割り当てられる最も高い周波数ビンを決定するステップと、
    前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが前記高周波帯域信号の帯域幅拡張周波数帯域のプリセット開始周波数ビン未満であるか否かを判定するステップと、
    前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン未満である場合に、所定の周波数帯域範囲内に含まれる、ならびに前記低周波帯域信号および前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン中の励振信号に従って前記高周波帯域信号の前記励振信号を予測するステップ、または
    前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン以上である場合に、所定の周波数帯域範囲内に含まれる、ならびに前記低周波帯域信号、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン、および前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンの中の励振信号に従って前記高周波帯域信号の前記励振信号を予測するステップと
    を含む、請求項1から3のいずれか一項に記載の方法。
  5. 所定の周波数帯域範囲内に含まれる、ならびに前記低周波帯域信号および前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビンの中の励振信号に従って前記高周波帯域信号の前記励振信号を予測する前記ステップは、
    前記所定の周波数帯域範囲内の前記励振信号のn個のコピーを作製し、前記励振信号の前記n個のコピーを前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビンと前記帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するステップであって、nは、正の整数または正の小数であり、nは、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビンと前記帯域幅拡張周波数帯域の前記最も高い周波数ビンとの間の周波数ビンの量の、前記所定の周波数帯域範囲内の周波数ビンの量に対する比に等しい、ステップ
    を含む、請求項4に記載の方法。
  6. 所定の周波数帯域範囲内に含まれる、ならびに前記低周波帯域信号、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン、および前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンの中の励振信号に従って前記高周波帯域信号の前記励振信号を予測する前記ステップは、
    前記所定の周波数帯域範囲の開始周波数ビンfexc_start超の第mの周波数ビンから前記所定の周波数帯域範囲の終了周波数ビンfexc_endまでの励振信号をコピーし、前記所定の周波数帯域範囲内の前記励振信号のn個のコピーを作製し、前記励振信号の2つの部分を前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンと前記帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するステップであって、nは、0、正の整数、または正の小数であり、mは、前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンと前記拡張周波数帯域の前記プリセット開始周波数ビンとの間の周波数ビンの量である、ステップ
    を含む、請求項4に記載の方法。
  7. 音声信号を符号化するための方法であって、
    音声信号の信号タイプおよび前記音声信号の低周波帯域信号を取得するステップであって、前記音声信号の信号タイプは調波または非調波である、ステップと、
    前記取得された信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを計算するステップであって、前記信号タイプが調波である場合に高周波帯域信号の周波数エンベロープを計算するためのスペクトル係数の量が、前記信号タイプが非調波である場合に高周波帯域信号の周波数エンベロープを計算するためのスペクトル係数の量とは異なる、ステップと、
    高周波帯域信号の周波数エンベロープの符号化インデックスを取得するために、前記高周波帯域信号の前記周波数エンベロープを符号化するステップと、
    前記取得された信号タイプと、前記低周波帯域信号の符号化インデックスおよび前記高周波帯域信号の前記周波数エンベロープの符号化インデックスとを伝達するビットストリームを送るステップと
    を含む方法。
  8. 前記音声信号の信号タイプが非調波である場合に、前記取得された信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを計算する前記ステップは、
    第1の量のスペクトル係数を使用することによって前記高周波帯域信号の前記周波数エンベロープを計算するステップを含み、かつ
    前記音声信号の信号タイプが調波である場合に、前記取得された信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを計算する前記ステップは、
    第2の量のスペクトル係数を使用することによって前記高周波帯域信号の前記周波数エンベロープを計算するステップを含み、
    前記第2の量は、前記第1の量よりも大きい、
    請求項7に記載の方法。
  9. 復号すべき音声信号の信号タイプおよび前記音声信号の低周波帯域信号を取得するように構成された第1の取得モジュールであって、前記音声信号の高周波帯域信号の信号タイプは調波または非調波である、第1の取得モジュールと、
    前記信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを取得するように構成された第2の取得モジュールと
    前記音声信号の前記低周波帯域信号に従って前記音声信号の前記高周波帯域信号の励振信号を予測するように構成された予測モジュールと、
    前記高周波帯域信号の前記周波数エンベロープおよび前記高周波帯域信号の前記励振信号に従って前記音声信号の前記高周波帯域信号を復元するように構成された復元モジュールと
    を備え
    前記音声信号の高周波帯域信号の信号タイプは、調波または非調波であり、
    前記信号タイプが非調波である場合に、前記第2の取得モジュールは、具体的には、前記信号タイプが非調波信号である場合の前記高周波帯域信号の前記周波数エンベロープを取得するために前記音声信号の受領したビットストリームを復号するように構成され、かつ、
    前記信号タイプが調波である場合に、前記第2の取得モジュールは、具体的には、前記信号タイプが調波信号である場合の前記高周波帯域信号の初期周波数エンベロープを取得するために前記音声信号の受領したビットストリームを復号し、前記初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープに加重計算を実施することによって取得される値を前記高周波帯域信号の前記周波数エンベロープとして使用するように構成され、Nは、1以上である、復号デバイス。
  10. 前記第1の取得モジュールは、具体的には前記信号タイプおよび前記低周波帯域信号を取得するために前記音声信号の受領したビットストリームを復号するように構成され、前記信号タイプは、調波信号または非調波信号である、請求項9に記載のデバイス。
  11. 前記第1の取得モジュールは、具体的には、前記音声信号の前記低周波帯域信号を取得するために前記音声信号の受領したビットストリームを復号し、前記低周波帯域信号に従って前記信号タイプを決定するように構成され、前記信号タイプは、調波信号または非調波信号である、請求項9に記載のデバイス。
  12. 前記予測モジュールは、
    前記低周波帯域信号のビットが割り当てられる最も高い周波数ビンを決定するように構成された決定ユニットと、
    前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが前記高周波帯域信号の帯域幅拡張周波数帯域のプリセット開始周波数ビン未満であるか否かを判定するように構成された判断ユニットと、
    前記判断ユニットが、前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン未満であると判定した場合に、所定の周波数帯域範囲内に含まれるならびに前記低周波帯域信号および前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビンの中の励振信号に従って前記高周波帯域信号の前記励振信号を予測するように構成された第1の処理ユニットと、
    前記判断ユニットが、前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン以上であると判定した場合に、所定の周波数帯域範囲内に含まれるならびに前記低周波帯域信号、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン、および前記低周波帯域信号のビンが割り当てられる前記最も高い周波数ビンの中の励振信号に従って前記高周波帯域信号の前記励振信号を予測するように構成された第2の処理ユニットと
    を備える、請求項9から11のいずれか一項に記載のデバイス。
  13. 前記第1の処理ユニットは、具体的には、前記判断ユニットが、前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン未満であると判定した場合に、前記所定の周波数帯域範囲内の前記励振信号のn個のコピーを作製し、前記励振信号の前記n個のコピーを、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビンと前記帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するように構成され、nは、正の整数または正の小数であり、nは、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビンと前記帯域幅拡張周波数帯域の前記最も高い周波数ビンとの間の周波数ビンの量の、前記所定の周波数帯域範囲内の周波数ビンの量に対する比に等しい、請求項12に記載のデバイス。
  14. 前記第2の処理ユニットは、具体的には、前記判断ユニットが、前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン以上であると判定した場合に、前記所定の周波数帯域範囲内の開始周波数ビンfexc_start超の第mの周波数ビンから前記所定の周波数帯域範囲の終了周波数ビンfexc_endまでの励振信号をコピーし、前記所定の周波数帯域範囲内の前記励振信号のn個のコピーを作製し、励振信号の2つの部分を前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンと前記帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するように構成され、nは、0、正の整数、または正の小数であり、mは、前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンと前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビンとの間の周波数ビンの量である、請求項12に記載のデバイス。
  15. 音声信号の信号タイプおよび前記音声信号の低周波帯域信号を取得するように構成された取得モジュールであって、前記音声信号の信号タイプは調波または非調波である、取得モジュールと、
    前記取得された信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを計算して、高周波帯域信号の周波数エンベロープの符号化インデックスを取得するために、前記高周波帯域信号の前記周波数エンベロープを符号化するように構成された符号化モジュールであって、前記信号タイプが調波である場合に高周波帯域信号の周波数エンベロープを計算するためのスペクトル係数の量が、前記信号タイプが非調波である場合に高周波帯域信号の周波数エンベロープを計算するためのスペクトル係数の量とは異なる、符号化モジュールと、
    前記取得された信号タイプと、前記低周波帯域信号の符号化インデックスおよび前記高周波帯域信号の前記周波数エンベロープの符号化インデックスとを伝達するビットストリームを送るように構成された送りモジュールと
    を備える、符号化デバイス。
  16. 前記音声信号の信号タイプが非調波である場合に、前記符号化モジュールは、具体的には、第1の量のスペクトル係数を使用することによって前記高周波帯域信号の前記周波数エンベロープを計算するように構成され、かつ
    前記音声信号の信号タイプが調波である場合に、前記符号化モジュールは、具体的には、第2の量のスペクトル係数を使用することによって前記高周波帯域信号の前記周波数エンベロープを計算するように構成され、
    前記第2の量は、前記第1の量よりも大きい、
    請求項15に記載のデバイス。
  17. コンピュータプログラムが記録されたコンピュータ読み出し可能な記録媒体であって、前記コンピュータプログラムは、請求項1から7のいずれか一項に記載の方法をコンピュータに実行させるものである、記録媒体。
JP2017165309A 2013-01-29 2017-08-30 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス Active JP6574820B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201310033625.3 2013-01-29
CN201310033625.3A CN103971693B (zh) 2013-01-29 2013-01-29 高频带信号的预测方法、编/解码设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015555543A Division JP6204501B2 (ja) 2013-01-29 2013-05-29 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス

Publications (2)

Publication Number Publication Date
JP2017223987A JP2017223987A (ja) 2017-12-21
JP6574820B2 true JP6574820B2 (ja) 2019-09-11

Family

ID=51241109

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2015555543A Active JP6204501B2 (ja) 2013-01-29 2013-05-29 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス
JP2017165309A Active JP6574820B2 (ja) 2013-01-29 2017-08-30 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2015555543A Active JP6204501B2 (ja) 2013-01-29 2013-05-29 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス

Country Status (10)

Country Link
US (3) US9704500B2 (ja)
EP (2) EP2937861B1 (ja)
JP (2) JP6204501B2 (ja)
KR (3) KR20150108421A (ja)
CN (2) CN106847297B (ja)
BR (1) BR112015018064B1 (ja)
ES (1) ES2822607T3 (ja)
HK (1) HK1199540A1 (ja)
SG (1) SG11201505885YA (ja)
WO (1) WO2014117458A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106847297B (zh) * 2013-01-29 2020-07-07 华为技术有限公司 高频带信号的预测方法、编/解码设备
EP3040987B1 (en) * 2013-12-02 2019-05-29 Huawei Technologies Co., Ltd. Encoding method and apparatus
SG10201808274UA (en) * 2014-03-24 2018-10-30 Samsung Electronics Co Ltd High-band encoding method and device, and high-band decoding method and device
US10839814B2 (en) * 2017-10-05 2020-11-17 Qualcomm Incorporated Encoding or decoding of audio signals
JP7077139B2 (ja) 2018-05-23 2022-05-30 株式会社豊田中央研究所 歪ゲージの製造方法および歪ゲージ
JP7061587B2 (ja) 2019-04-05 2022-04-28 Ckd株式会社 流体制御弁
US10978083B1 (en) 2019-11-13 2021-04-13 Shure Acquisition Holdings, Inc. Time domain spectral bandwidth replication
CN113192521A (zh) * 2020-01-13 2021-07-30 华为技术有限公司 一种音频编解码方法和音频编解码设备
CN112767954A (zh) * 2020-06-24 2021-05-07 腾讯科技(深圳)有限公司 音频编解码方法、装置、介质及电子设备
CN114582361B (zh) * 2022-04-29 2022-07-08 北京百瑞互联技术有限公司 基于生成对抗网络的高解析度音频编解码方法及系统

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3751225B2 (ja) * 2001-06-14 2006-03-01 松下電器産業株式会社 オーディオ帯域拡張装置
JP2003044098A (ja) 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP5129115B2 (ja) 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 高帯域バーストの抑制のためのシステム、方法、および装置
UA91853C2 (ru) * 2005-04-01 2010-09-10 Квелкомм Инкорпорейтед Способ и устройство для векторного квантования спектрального представления огибающей
KR100770839B1 (ko) * 2006-04-04 2007-10-26 삼성전자주식회사 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US20080109215A1 (en) * 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
CN101140759B (zh) 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
CN101939782B (zh) 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
JP4529092B2 (ja) * 2007-09-25 2010-08-25 ソニー株式会社 チューナ装置
KR100970446B1 (ko) 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
WO2009078681A1 (en) * 2007-12-18 2009-06-25 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2224432B1 (en) 2007-12-21 2017-03-15 Panasonic Intellectual Property Corporation of America Encoder, decoder, and encoding method
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
CN101751926B (zh) 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
CN101763856B (zh) * 2008-12-23 2011-11-02 华为技术有限公司 信号分类处理方法、分类处理装置及编码系统
CN101770775B (zh) * 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
CN102598123B (zh) * 2009-10-23 2015-07-22 松下电器(美国)知识产权公司 编码装置、解码装置及其方法
CN102044250B (zh) * 2009-10-23 2012-06-27 华为技术有限公司 频带扩展方法及装置
UA102347C2 (ru) 2010-01-19 2013-06-25 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
CN101964189B (zh) 2010-04-28 2012-08-08 华为技术有限公司 语音频信号切换方法及装置
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CN102436820B (zh) * 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
ES2681429T3 (es) * 2011-02-14 2018-09-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generación de ruido en códecs de audio
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
CN106847297B (zh) * 2013-01-29 2020-07-07 华为技术有限公司 高频带信号的预测方法、编/解码设备
CN103971694B (zh) * 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
BR122020016403B1 (pt) * 2013-06-11 2022-09-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Aparelho de decodificação de sinal de áudio, aparelho de codificação de sinal de áudio, método de decodificação de sinal de áudio e método de codificação de sinal de áudio

Also Published As

Publication number Publication date
KR101837191B1 (ko) 2018-03-09
EP2937861A4 (en) 2016-08-03
JP6204501B2 (ja) 2017-09-27
KR101980057B1 (ko) 2019-05-17
CN106847297B (zh) 2020-07-07
WO2014117458A1 (zh) 2014-08-07
JP2017223987A (ja) 2017-12-21
EP3779980A2 (en) 2021-02-17
KR20180026812A (ko) 2018-03-13
US20170270944A1 (en) 2017-09-21
JP2016509256A (ja) 2016-03-24
BR112015018064A2 (pt) 2017-07-18
SG11201505885YA (en) 2015-09-29
KR20170043665A (ko) 2017-04-21
EP2937861B1 (en) 2020-08-12
US10089997B2 (en) 2018-10-02
US9704500B2 (en) 2017-07-11
CN103971693A (zh) 2014-08-06
BR112015018064B1 (pt) 2020-12-01
ES2822607T3 (es) 2021-05-04
KR20150108421A (ko) 2015-09-25
CN106847297A (zh) 2017-06-13
HK1199540A1 (en) 2015-07-03
US10636432B2 (en) 2020-04-28
CN103971693B (zh) 2017-02-22
US20150332699A1 (en) 2015-11-19
US20180366134A1 (en) 2018-12-20
EP3779980A3 (en) 2021-07-07
EP2937861A1 (en) 2015-10-28

Similar Documents

Publication Publication Date Title
JP6574820B2 (ja) 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス
US10607621B2 (en) Method for predicting bandwidth extension frequency band signal, and decoding device
JP6364518B2 (ja) オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置
CN110706715B (zh) 信号编码和解码的方法和设备
KR20160138373A (ko) 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 및 프로그램
WO2015000373A1 (zh) 信号编码和解码方法以及设备
JP2017507366A (ja) 信号処理方法及び装置
JP2016529542A (ja) ロストフレームを処理するための方法および復号器

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170928

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190722

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190819

R150 Certificate of patent or registration of utility model

Ref document number: 6574820

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250