JP6773737B2 - 音響信号の帯域幅拡張を行う装置及び方法 - Google Patents

音響信号の帯域幅拡張を行う装置及び方法 Download PDF

Info

Publication number
JP6773737B2
JP6773737B2 JP2018173725A JP2018173725A JP6773737B2 JP 6773737 B2 JP6773737 B2 JP 6773737B2 JP 2018173725 A JP2018173725 A JP 2018173725A JP 2018173725 A JP2018173725 A JP 2018173725A JP 6773737 B2 JP6773737 B2 JP 6773737B2
Authority
JP
Japan
Prior art keywords
frequency
spectrum
harmonic
low frequency
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018173725A
Other languages
English (en)
Other versions
JP2019008316A (ja
Inventor
スリカンス ナギセティ
スリカンス ナギセティ
ゾンシャン リウ
ゾンシャン リウ
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ, フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2019008316A publication Critical patent/JP2019008316A/ja
Priority to JP2020166633A priority Critical patent/JP7330934B2/ja
Application granted granted Critical
Publication of JP6773737B2 publication Critical patent/JP6773737B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Description

本発明は、音響信号処理に関し、特に、音響信号の帯域幅拡張のための音響信号の符号化及び復号処理に関する。
通信において、ネットワークリソースをより効率的に使用するために、オーディオコーデックには、主観的品質の許容できる範囲で音響信号を低ビットレートに圧縮することが導入されている。よって、音響信号の符号化の際、ビットレートの制約を克服するために、圧縮効率を向上させる必要がある。
BWE(bandwidth extension:帯域幅拡張)は、WB(wideband:広帯域)又はSWB(super-wideband:超広帯域)の音響信号を低ビットレートに効率的に圧縮するために、音響信号の符号化において広く使用されている技術である。符号化におけるBWEは、復号された低周波帯域信号を用いてパラメトリックに高周波帯域信号を表現する。すなわち、BWEは、音響信号の低周波帯域信号の中で高周波帯域信号のサブバンドと類似する部分を探索して特定し、その類似する部分を特定するパラメータを符号化して送信し、受信側で低周波帯域信号を用いて高周波帯域信号を再合成できるようにする。高周波帯域信号を直接的に符号化せず、低周波帯域信号の類似する部分を利用することで伝送するパラメータの情報量を少なくでき、圧縮効率を向上できる。
BWEの機能を利用した音響信号のコーデックの1つとして、G.718−SWBがある。G.718−SWBの適用対象は、VoIP装置、テレビ会議設備、電話会議設備、及び、携帯電話である。
G.718−SWBの構成を図1及び図2に示す(例えば、非特許文献1を参照)。
図1に示す符号化装置側では、32kHzでサンプリングされた音響信号(以下、入力信号という)は、まず、16kHzにダウンサンプリングされる(101)。ダウンサンプリングされた信号は、G.718コア符号化部によって符号化される(102)。SWB帯域幅拡張は、MDCT領域において行われる。32kHz入力信号は、MDCT領域に変換され(103)、トーン性推定部を介して処理される(104)。入力信号の推定されたトーン性に基づいて(105)、ジェネリック(generic)モード(106)又は正弦波(sinusoidal)モード(108)がSWBの第1レイヤ符号化に用いられる。より上位のSWBレイヤは、追加正弦波(additional sinusoid)を用いて符号化される(107及び109)。
ジェネリックモードは、入力フレームの信号が非トーンと見なされる場合に使用される。ジェネリックモードにおいて、G.718コア符号化部によって符号化されたWB信号のMDCT係数(スペクトル)は、SWB MDCT係数(スペクトル)の符号化に利用される。SWB周波数帯域(7−14kHz)はいくつかのサブバンドに分割され、全てのサブバンドに対して、符号化され正規化されたWB MDCT係数から、最も相関の高い部分が探索される。そして、最も相関の高い部分のゲインは、SWBのサブバンドの振幅レベルを再現できるようスケール計算され、SWB信号の高周波成分の媒介変数表示(パラメトリック表現)が得られる。
正弦波モード符号化は、トーンに分類されるフレームにおいて使用される。正弦波モードにおいて、SWB信号は、正弦波成分の有限集合をSWBスペクトルに加えることにより生成される。
図2に示す復号装置側では、G.718コアコーデックは、WB信号を16kHzサンプリングレートで復号する(201)。WB信号は、後処理された後(202)、32kHzサンプリングレートにアップサンプリングされる(203)。SWB周波数成分は、SWB帯域幅拡張によって再構成される。SWB帯域幅拡張は主にMDCT領域で行われる。ジェネリックモード(204)及び正弦波モード(205)は、SWBの第1レイヤの復号に用いられる。より上位のSWBレイヤは、追加正弦波モードを用いて復号される(206及び207)。再構成されたSWB MDCT係数は、時間領域に変換され(208)、後処理(209)の後、G.718コア復号部によって復号されたWB信号に加算され、時間領域のSWB出力信号が再構成される。
ITU-T Recommendation G.718 Amendment 2, New Annex B on superwideband scalable extension for ITU-T G.718 and corrections to main body fixed-point C-code and description text, March 2010.
G.718−SWBの構成に見られるように、入力信号のSWB帯域幅拡張は、正弦波モード又はジェネリックモードのいずれかによって行われる。
例えば、ジェネリック符号化のメカニズムに対して、高周波数成分は、WBスペクトルから最も相関の高い部分を探索することにより生成される(得られる)。通常、このアプローチのタイプは、特に高調波を有する信号に対する性能に問題を抱える。このアプローチは、低周波帯域の高調波成分(トーン成分)と複製された高周波帯域のトーン成分との間のハーモニクス(高調波)関係を全く維持していない。このことは、聴感的品質を劣化させる不明瞭なスペクトルの原因となる。
したがって、不明瞭なスペクトル、又は、複製された高周波帯域信号のスペクトル(高周波数スペクトル)における乱れによって生成される聴感ノイズ(又はartifact)を抑圧するために、低周波帯域信号のスペクトル(低周波数スペクトル)と高周波数スペクトルとの間のハーモニクス関係を維持することが望ましい。
この問題を解決するために、G.718−SWBの構成は、正弦波モードを備えている。正弦波モードは、正弦波を用いて重要なトーン成分を符号化するので、良好なハーモニクス構造が維持される。しかしながら、人工的なトーン信号によってSWB成分を単純に符号化すると、結果として得られる音声品質は必ずしも十分に良好にはならないという課題がある。
本発明は、上記ジェネリックモードが抱える高調波(ハーモニクス)を有する信号に対する符号化性能を改善することを目的とし、スペクトルの微細(fine)構造を維持しつつ、低周波数スペクトルと複製された高周波数スペクトルとの間のトーン成分のハーモニクス構造を維持するための効率的な方法を提供するものである。まず、WBスペクトルから高調波の周波数の値を推定することにより低周波数スペクトルのトーン成分と高周波数スペクトルのトーン成分との関係が得られる。次いで、符号化装置側で符号化された低周波数スペクトルが復号され、インデックス情報に従って高周波数スペクトルのサブバンドに最も相関の高い部分がエネルギレベル調整されたうえで高周波帯域にコピーされることで高周波数スペクトルが複製される。複製された高周波数スペクトルにおけるトーン成分の周波数は、推定された高調波の周波数の値に基づいて特定又は調整される。
低周波数スペクトルのトーン成分と複製された高周波数スペクトルのトーン成分との間のハーモニクス関係は、高調波の周波数の推定が正確である場合のみ維持される。このため、推定精度を向上させるために、高調波の周波数を推定する前にトーン成分を構成するスペクトルピークの補正を行う。
この発明により、特に、ハーモニクス構造を有する入力信号に対して、帯域幅拡張により再構成された高周波数スペクトルにおけるトーン成分を正確に複製し、良好な音声品質を低ビットレートで効率的に得ることができる。
G.718−SWB符号化装置の構成を示す図 G.718−SWB復号装置の構成を示す図 本発明の実施の形態1に係る符号化装置の構成を示すブロック図 本発明の実施の形態1に係る復号装置の構成を示すブロック図 スペクトルピーク検出の補正アプローチを示す図 高調波周波数調整方法の一例を示す図 高調波周波数調整方法の他の例を示す図 本発明の実施の形態2に係る符号化装置の構成を示すブロック図 本発明の実施の形態2に係る復号装置の構成を示すブロック図 本発明の実施の形態3に係る符号化装置の構成を示すブロック図 本発明の実施の形態3に係る復号装置の構成を示すブロック図 本発明の実施の形態4に係る復号装置の構成を示すブロック図 合成された低周波数スペクトルに対する高調波周波数調整方法の一例を示す図 合成された低周波数スペクトルに対して欠落した高調波を注入するアプローチの一例を示す図
本発明の主な原理は図3〜図14を用いてこのセクションに記載されている。当業者であれば、本発明の主旨から逸脱することなく、この発明を変更又は適合させることが可能である。
(実施の形態1)
本発明に係るコーデックの構成を図3及び図4に示す。
図3に示す符号化装置側では、サンプリングされた入力信号は、まず、ダウンサンプリングされる(301)。ダウンサンプリングされた低周波帯域の信号(低周波数信号)は、コア符号化部により符号化される(302)。コア符号化パラメータは、ビットストリームを形成するために多重化部(307)へ送られる。また、入力信号は時間-周波数(T/F)変換部(303)で周波数領域の信号に変換され、その高周波帯域信号(高周波数信号)は複数のサブバンドに分割される。符号化部は、既存の狭帯域又は広帯域のオーディオ又は音声コーデックでもよく、一例としてG.718が挙げられる。コア符号化部(302)は、単に符号化するだけでなく、ローカルな復号部及び時間−周波数変換部も備えており、ローカルな復号を行い、復号された信号(合成信号)の時間−周波数変換を行い、合成低周波数信号をエネルギ正規化部(304)へ供給する。正規化された周波数領域の合成低周波数信号は、以下のようにして帯域幅拡張に利用される。まず、類似度探索部(305)が、この正規化された低周波数合成数信号中で入力信号の高周波数信号の各サブバンドと最も相関の高い部分を特定し、探索結果であるインデックス情報を多重化部(307)へ送る。次に、この最も相関の高い部分と入力信号の高周波数信号の各サブバンドとのスケールファクタ情報が推定され(306)、符号化されたスケールファクタ情報は多重化部(307)へ送られる。
最後に、多重化部(307)は、コア符号化パラメータ、インデックス情報及びスケールファクタ情報を、ビットストリームに統合する。
図4に示す復号装置では、逆多重化部(401)は、ビットストリームを解いて、コア符号化パラメータ、インデックス情報及びスケールファクタ情報を得る。
コア復号部は、コア符号化パラメータを用いて、合成低周波数信号を再構成する(402)。合成低周波数信号は、アップサンプリングされる(403)とともに帯域幅拡張にも用いられる(410)。
この帯域幅拡張は以下のように行われる。すなわち、合成低周波数信号をエネルギ正規化し(404)、符号化装置側で導出された入力信号の高周波数信号の各サブバンドとの相関が最も高い部分を特定するインデックス情報に従って特定された低周波数信号を高周波帯域にコピーし(405)、入力信号の高周波数信号のエネルギレベルと同じレベルにするために、スケールファクタ情報に従ってエネルギレベル調整を行う(406)。
また、高調波の周波数は、合成低周波数信号のスペクトルから推定される(407)。推定された高調波の周波数は、高周波数信号のスペクトルにおいてトーン成分の周波数を調整するために使用される(408)。
再構成された高周波数信号は、周波数領域から時間領域に変換され(409)、アップサンプリングされた合成低周波数信号に加算され、時間領域の出力信号を生成する。
高調波の周波数の推定方式の詳細な処理について以下に説明する。
1)合成低周波数信号(LF)のスペクトルから、高調波の周波数を推定するための部分を選択。選択された部分は、選択された部分から推定される高調波の周波数が信頼できるものであるために、鮮明なハーモニクス構造を有するべきである。通常、全ての高調波に対して、1−2kHzからカットオフ周波数の付近において鮮明なハーモニクス構造が観察される。
2)選択された部分を人間のピッチ周波数に近い幅(100Hz〜400Hz程度)の多数のブロックに分割。
3)各ブロック内において振幅が最大となるスペクトル(スペクトルピーク)、及びスペクトルピークの周波数(スペクトルピーク周波数)を探索。
4)エラー回避又は高調波の周波数の推定精度向上のために、特定したスペクトルピークに対して後処理を実施。
後処理の一例を、図5に示すスペクトルを用いて説明する。
合成低周波数信号のスペクトルに基づいて、スペクトルピーク、及び、スペクトルピーク周波数が算出される。ただし振幅が小さく、隣りあうスペクトルピークとのスペクトルピーク周波数の間隔が非常に短いスペクトルピークは削除される。これにより、高調波の周波数の値を算出する際の推定誤りを回避する。
1)特定されたスペクトルピーク周波数の間隔を算出。
2)特定されたスペクトルピーク周波数の間隔に基づいて高調波の周波数を推定。高調波の周波数を推定する方法の一つを以下に示す。
Figure 0006773737
高調波の周波数の推定は、以下のような方法でも行うことができる。
1)合成低周波数信号(LF)のスペクトルにおいて、高調波の周波数を推定するため、推定される高調波の周波数の信頼性が担保できるよう鮮明なハーモニクス構造を有する部分を選ぶ。通常、全ての高調波に対して、1−2kHzからカットオフ周波数の付近において鮮明なハーモニクス構造が見られる。
2)上記の合成低周波数信号(スペクトル)の選択された部分の中で最大の振幅(絶対値)を有するスペクトルとその周波数を特定する。
3)この最大振幅のスペクトルのスペクトル周波数から、ほぼ等しい周波数間隔を有し、かつ振幅の絶対値が所定の閾値を越えるスペクトルピークのセットを特定する。所定の閾値としては例えば前述の選択された部分のスペクトル振幅の標準偏差の2倍の値が採用できる。
4)上記スペクトルピーク周波数の間隔を算出する。
5)上記スペクトルピーク周波数の間隔に基づいて高調波の周波数を推定する。なお、この場合にも高調波の周波数を推定するため、式(1)の方法を使用可能である。
ところで、極めて低いビットレートの場合には、合成低周波数信号のスペクトル内の高調波成分が十分に符号化されない場合がある。この場合、特定されるいくつかのスペクトルピークは、入力信号の高調波成分に全く対応していない可能性がある。このため、高調波の周波数の算出において、スペクトルピーク周波数の間隔が平均的な値と大きく異なる場合には、この算出対象から除外した方がよい。
また、スペクトルピークの振幅が比較的小さいとか、符号化のためのビットレートの制限などから、必ずしも全ての高調波成分が符号化できない(つまり合成低周波数信号のスペクトルのいくつかの高調波成分が欠落している)場合がある。このような場合には、欠落する高調波部分において抽出されるスペクトルピーク周波数の間隔は、良好なハーモニクス構造を有する部分で抽出されるスペクトルピーク周波数の間隔の2倍又は数倍となると考えられる。この場合には最大のスペクトルピーク周波数の間隔を含む所定の範囲に含まれるスペクトルピーク周波数の間隔の抽出値の平均値を高調波の周波数の推定値とする。これにより、高周波数スペクトルを適切に複製することができる。具体的には、以下のステップからなる。
1)スペクトルピーク周波数の間隔の最小値及び最大値を特定する。
Figure 0006773737
2)次の範囲における全てのスペクトルピーク周波数の間隔を特定する。
Figure 0006773737

3)上記範囲において特定されるスペクトルピーク周波数の間隔の平均値を高調波の周波数の推定値とする。
次に、高調波周波数調整方式の一例を以下に説明する。
1)合成低周波数信号(LF)のスペクトルにおける符号化された最後のスペクトルピーク、及び、そのスペクトルピーク周波数を特定する。
2)帯域幅拡張により複製された高周波数スペクトル内のスペクトルピーク及びスペクトルピーク周波数を特定する。
3)合成低周波数信号スペクトルのスペクトルピークのうち、最大のスペクトルピーク周波数を基準として、スペクトルピーク周波数の間隔が高調波の周波数間隔の推定値と等しくなるように、スペクトルピーク周波数を調整する。この処理を図6に示す。図6に示すように、まず、合成低周波数信号スペクトル中で最大のスペクトルピーク周波数、及び、複製された高周波数スペクトル内のスペクトルピークを特定する。そして、複製された高周波数スペクトル内の最小のスペクトルピーク周波数を持つものを、合成低周波数信号スペクトルの最大のスペクトルピーク周波数からEstHarmonicの間隔を有する周波数にシフトする。複製された高周波数スペクトル内のスペクトルピーク周波数が2番目に小さなものは、上記のシフトされた最小のスペクトルピーク周波数からEstHarmonicの間隔を有する周波数にシフトする。複製された高周波数スペクトル内の全てのスペクトルピークのスペクトルピーク周波数についてこのような調整が完了するまでこの処理を繰り返す。
また、以下のような高調波周波数調整方式も可能である。
1)合成低周波数信号(LF)のスペクトルの最大のスペクトルピーク周波数を持つものを特定する。
2)帯域幅拡張により帯域幅拡張される高周波数(HF)スペクトル内のスペクトルピーク及びスペクトルピーク周波数を特定する。
3)合成低周波数信号スペクトルの最大のスペクトルピーク周波数を基準として、HFスペクトルにおいて採りうるスペクトルピーク周波数を算出する。帯域幅拡張により複製された高周波数スペクトル内の各スペクトルピークを算出されたスペクトルピーク周波数のうち各スペクトルピーク周波数に最も近い周波数へ移動する。この処理を図7に示す。図7に示すように、まず、合成低周波数スペクトルの最大のスペクトルピーク周波数を持つもの、及び、複製された高周波数スペクトル内のスペクトルピークが抽出される。そして、複製された高周波数スペクトル内で採りうるスペクトルピーク周波数が算出される。合成低周波数信号スペクトルの最大のスペクトルピーク周波数からEstHarmonicの間隔を有する周波数を、複製された高周波数スペクトル内のスペクトルピークが1番目に採りうるスペクトルピークの周波数とする。次に上記1番目の採りうるスペクトルピーク周波数からEstHarmonicの間隔を有する周波数を、2番目に採りうるスペクトルピークの周波数とする。高周波数スペクトル内で計算できる限りこの処理を繰り返す。
その後、複製された高周波数スペクトルにおいて抽出されたスペクトルピークを、上記で算出した採りうるスペクトルピーク周波数のうちスペクトルピーク周波数が最も近い周波数にシフトする。
推定高調波の値EstHarmonicは、整数の周波数ビンに対応しない場合もある。この場合、スペクトルピーク周波数は、EstHarmonicに基づいて導出される周波数に最も近い周波数ビンとなるように選択する。
なお、高調波の周波数の推定に前フレームのスペクトルが利用されるような高調波の周波数の推定方法、及び、トーン成分の調整の際にフレーム移行がスムーズになるように前フレームのスペクトルが考慮されるようなトーン成分の周波数の調整方法も考えられる。また、トーン成分の周波数をシフトしても元のスペクトルのエネルギレベルが維持されるように振幅を調整してもよい。これらの軽微な変更は全て、本発明の範囲に含まれる。
上記は全て例示であって、本発明の着想はこれらに限定されるものではない。当業者であれば、本発明の主旨から逸脱することなく本発明を変更又は修正することが可能である。
[効果]
本発明に係る帯域幅拡張方法は、高周波数スペクトルと最も相関の高い合成低周波数信号スペクトルを用いて高周波数スペクトルを複製するとともに、スペクトルピークを推定された高調波の周波数へシフトするものである。これにより、スペクトルの微細構造、及び、低周波帯域のスペクトルピークと複製された高周波帯域のスペクトルピークとの間のハーモニクス構造の双方を維持することができる。
(実施の形態2)
本発明の実施の形態2は、図8及び図9に示される。
実施の形態2に係る符号化装置は、高調波周波数推定部(708,709),高調波周波数比較部(710)を除いて、実施の形態1とほぼ同一である。
高調波の周波数は、合成低周波数スペクトル(708)と入力信号の高周波数スペクトル(709)とで別々に推定され、両者の推定値の比較結果(710)に基づいてフラグ情報が送信される。一例として、フラグ情報は以下の式のように導出することができる。
Figure 0006773737
すなわち、合成低周波数信号のスペクトル(合成低周波数スペクトル)から推定される高調波の周波数EstHarmonic_LFと、入力信号の高周波数スペクトルから推定される高調波の周波数EstHarmonic_HFとが比較され、2つの値の差分が十分に小さい場合には、合成低周波数スペクトルからの推定が十分に正確であると考え、高調波周波数調整に使用しても良いことを意味するフラグ(Flag=1)がセットされる。一方、2つの値の差分が小さくない場合、合成低周波数スペクトルからの推定値が正確ではないと考え、高調波周波数調整に使用すべきでないことを意味するフラグ(Flag=0)がセットされる。
図9に示す復号装置側では、フラグ情報の値によって複製された高周波数スペクトルに対して高調波周波数調整(810)を適用するか否かを決定する。すなわち、復号装置は、Flag=1の場合、高調波周波数調整を行い、Flag=0の場合、高調波周波数調整を行わない。
[効果]
いくつかの信号に対して、合成低周波数スペクトルから推定した高調波の周波数は、入力信号の高周波数スペクトルの高調波の周波数と異なる場合がある。特に低ビットレートでは、低周波数スペクトルのハーモニクス構造は良好に維持されない。フラグ情報を送ることによって、誤った高調波の周波数の推定値を用いたトーン成分の調整を回避することができる。
(実施の形態3)
本発明の実施の形態3は、図10及び図11に示される。
実施の形態3に係る符号化装置は、差分器(910)を除いて、実施の形態2とほぼ同一である。
高調波の周波数は、合成低周波数スペクトル(908)と入力信号の高周波数スペクトル(909)とで別々に推定される。2つの推定高調波の周波数の差分(Diff)が算出され(910)、復号装置側へ送信される。
図11に示す復号装置側では、差分値(Diff)は、合成低周波数スペクトルからの高調波の周波数の推定値に加算され(1010)、新に算出された高調波の周波数の値が複製された高周波数スペクトルにおける高調波周波数調整に使用される。
差分値の代わりに、入力信号の高周波数スペクトルから推定された高調波の周波数が復号部へ直接送信されてもよい。そして、入力信号の高周波数スペクトルの高調波の周波数の受信値を用いて高調波周波数調整が行われる。これによって復号装置側での合成低周波数スペクトルからの高調波の周波数の推定は不要となる。
[効果]
いくつかの信号に対して、合成低周波数スペクトルから推定した高調波の周波数は、入力信号の高周波数スペクトルの高調波の周波数と異なる場合があるため、差分値、又は、入力信号の高周波数スペクトルから導出された高調波の周波数の値を送ることによって、受信側である復号装置で帯域幅拡張して複製した高周波数スペクトルのトーン成分の調整をより精度良く行うことができる。
(実施の形態4)
本発明の実施の形態4は、図12に示される。
実施の形態4に係る符号化装置は、他の従来の符号化装置、又は、実施の形態1、2又は3と同一である。
図12に示す復号装置側では、合成低周波数スペクトルから高調波の周波数が推定される(1103)。この高調波の周波数の推定値は、低周波数スペクトルでの高調波注入(1104)に用いられる。
特に、利用可能なビットレートが低い場合、いくつかの低周波数スペクトルの高調波成分はほとんど符号化されないか、あるいは全く符号化されない場合がある。この場合、高調波の周波数の推定値は、欠落した高調波成分を注入するために使用することができる。
このことを図13に示す。図13では、合成低周波数(LF)スペクトル内に高調波成分の欠落があることが分かる。その周波数は、高調波の周波数の推定値を用いて導出可能である。また、その振幅は、例えば他の既存のスペクトルピークの振幅の平均値、又は、周波数軸上で欠落した高調波成分に近接する既存のスペクトルピークの振幅の平均値を用いればよい。この周波数及び振幅に従って生成された高調波成分が欠落した高調波成分を復元するものとして注入される。
欠落した高調波成分を注入する他のアプローチについて以下で説明する。
1.符号化されたLFスペクトルを用いて高調波の周波数を推定する(1103)。
1.1 高調波の周波数を、符号化された低周波数スペクトル内で特定されたスペクトルピーク周波数の間隔を用いて推定する。
1.2 欠落した高調波部分で導出されたスペクトルピーク周波数の間隔の値は良好なハーモニクス構造を維持している部分で導出されるスペクトルピーク周波数の間隔の値の2倍又は数倍となる。このようなスペクトルピーク周波数の間隔は、異なるカテゴリにグループ化され、それぞれに対して平均的なスペクトルピーク周波数の間隔が推定される。以下にその詳細を説明する。
a.スペクトルピーク周波数の間隔の値の最小値及び最大値を特定する。
Figure 0006773737

b.次の範囲における全ての間隔の値を特定する。
Figure 0006773737

c.上記範囲において特定される間隔の値の平均値を高調波の周波数の推定値として算出する。
Figure 0006773737

2.高調波の周波数の推定値を用いて、欠落した高調波成分を注入する。
2.1 選択されたLFスペクトルをいくつかの領域に分割する。
2.2 領域情報及び推定された周波数を用いることにより欠落した高調波を特定する。
例えば、選択されたLFスペクトルが3つの領域r1,r2,r3に分割されたとする。
領域情報に基づいて、高調波が特定され、高調波が注入される。
高調波に対する信号特性により、高調波間のスペクトルギャップは、r1及びr2の領域ではEstHarmonicLF1となり、r3の領域ではEstHarmonicLF2となる。この情報は、LFスペクトルの拡張に使用することができる。このことを更に図14に示す。図14では、LFスペクトルの領域r2に欠落した高調波成分があることが分かる。この周波数は、高調波の周波数の推定値EstHarmonicLF1を用いて導出可能である。
同様に、EstHarmonicLF2は、領域r2での欠落した高調波のトラッキング及び注入に使用される。
また、その振幅は、欠落していない全高調波成分の振幅の平均値、または欠落した高調波成分の前後に連なる高調波成分の振幅の平均値を用いることができる。又は、振幅はWBスペクトルで最小振幅を有するスペクトルピークを用いてもよい。その周波数及び振幅を用いて生成された高調波成分が欠落した高調波成分を復元するものとしてLFスペクトルに注入される。
[効果]
いくつかの信号に対して、合成低周波数スペクトルは維持されない場合がある。特に低ビットレートでは、いくつかの高調波成分は欠落する可能性がある。LFスペクトルで欠落した高調波成分を注入することにより、LFの拡張のみでなく、再構成される高調波のハーモニクス特性を向上させることができる。これにより、高調波の欠落による聴感的な影響を抑圧して、音声品質を更に向上させることができる。
2013年6月11日出願の特願2013−122985の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る符号化装置、復号装置及び符号化/復号方法は、ワイヤレス通信端末装置、移動通信システムにおける基地局装置、電話会議端末装置、テレビ会議端末装置、及び、VOIP端末装置に適用可能である。

Claims (17)

  1. 符号化情報から符号化パラメータ、インデックス情報、およびスケールファクタ情報を取り出す逆多重化部と、
    複製された高周波数サブバンドスペクトルを得るために、前記インデックス情報に基づき、合成低周波数スペクトルを用いて高周波数サブバンドスペクトルを複製するスペクトル複製部であって、前記合成低周波数スペクトルは前記符号化パラメータを復号することによって得られる、スペクトル複製部と、
    前記スケールファクタ情報を用いて、前記複製された高周波数サブバンドスペクトルの振幅を調整するスペクトル包絡調整部と、
    前記複製された高周波数サブバンドスペクトルにおける高調波成分の周波数を推定する高調波周波数推定部と、
    前記合成低周波数スペクトルを用いて推定され高調波周波数を用いて前記複製された高周波数サブバンドスペクトルにおける高調波成分の周波数を調整する高調波周波数調整部と、
    前記合成低周波数スペクトルと前記高調波成分の周波数が調整された前記複製された高周波数サブバンドスペクトルとを用いて出力信号を生成する出力部と、
    を具備する、音響信号復号装置。
  2. 前記高調波周波数推定部は、
    前記合成低周波数スペクトルの中で予め選択された部分を数のブロックに分割する分割部と、
    前記複数のブロックのそれぞれにおいて、最大の振幅を有するスペクトルピークの周波数を特定するスペクトルピーク特定部と、
    前記特定された各スペクトルピークの周波数の間隔を算出する間隔算出部と、
    前記特定されたスペクトルピークの周波数の前記間隔を用いて、前記高調波周波数を算出する高調波周波数算出部と、を具備する、
    請求項1に記載の音響信号復号装置。
  3. 前記高調波周波数推定部は、
    前記合成低周波数スペクトルの前記予め選択された部分で振幅の絶対値が最大となるスペクトルと当該スペクトルから周波数軸上でほぼ等間隔に位置し、かつ振幅の絶対値が所定の閾値以上のスペクトルを特定するスペクトルピーク特定部と、
    前記特定されたスペクトルピークの周波数の間隔を算出する間隔算出部と、
    前記特定されたスペクトルピークの周波数の間隔を用いて、前記高調波周波数を算出する高調波周波数算出部と、を具備する、
    請求項1に記載の音響信号復号装置。
  4. 前記高調波周波数調整部は、
    前記合成低周波数スペクトルにおけるスペクトルピークのうち最大周波数のものの周波数を特定する低周波数スペクトルピーク特定部と、
    前記複製された高周波数サブバンドスペクトルにおける複数のスペクトルピークの周波数を特定する高周波数スペクトルピーク特定部と、
    前記合成低周波数スペクトルにおけるスペクトルピークのうち最大周波数のものの周波数を基準として、前記複数のスペクトルピークの周波数の間隔が前記推定された高調波の周波数と等しくなるように、前記複数のスペクトルピークの周波数を調整する調整部と、を具備する、
    請求項1に記載の音響信号復号装置。
  5. 前記高調波周波数調整部は、
    前記合成低周波数スペクトルにおけるスペクトルピークのうち最大周波数のものの周波数を特定する低周波数スペクトルピーク特定部と、
    前記複製された高周波数サブバンドスペクトルにおける複数のスペクトルピークの周波数を特定する高周波数スペクトルピーク特定部と、
    前記合成低周波数スペクトルにおけるスペクトルピークのうち最大周波数のものの周波数に前記推定された高調波の周波数の整数倍の周波数を加算した周波数を、採りうるスペクトルピーク周波数として算出するスペクトルピーク周波数算出部と、
    前記複製された高周波数サブバンドスペクトル内の前記複数のスペクトルピークの周波数を、前記算出された採りうるスペクトルピーク周波数のうち最も近い周波数へ調整する調整部と、を具備する、
    請求項1に記載の音響信号復号装置。
  6. 符号化パラメータと、インデックス情報とスケールファクタ情報とフラグ情報を逆多重化する逆多重化部と、
    複製された高周波数サブバンドスペクトルを得るために、合成低周波数スペクトルから、前記インデックス情報に基づいて高周波数サブバンドスペクトルを再構成するスペクトル複製部であって、前記合成低周波数スペクトルは前記符号化パラメータを復号して得られる、スペクトル複製部と、
    前記スケールファクタ情報を用いて、前記複製された高周波数サブバンドスペクトルの振幅を調整するスペクトル包絡調整部と、
    前記合成低周波数スペクトルから高調波の周波数を推定する高調波周波数推定部と、
    前記推定された高調波の周波数に基づいて、前記合成低周波数スペクトルから前記複製された高周波数サブバンドスペクトルにおけるトーン成分の周波数を調整する高調波周波数調整部と、
    前記フラグ情報に基づいて、前記高調波周波数調整部を動作させるか否かを決定する決定部と、を具備し、
    前記合成低周波数スペクトルと、前記高調波成分の周波数が調整された前記複製された高周波数サブバンドスペクトルを用いて出力信号を生成する、
    音響信号復号装置。
  7. 前記推定された高調波の周波数に基づいて、前記合成低周波数スペクトルで欠落した高調波成分を特定する欠落高調波成分特定部と、
    前記合成低周波数スペクトルに前記欠落した高調波成分を注入する高調波注入部と、を更に具備する、
    請求項1又は6に記載の音響信号復号装置。
  8. 前記高調波注入部は、
    欠落していない全高調波成分の振幅の平均値または周波数軸上で欠落した高調波成分の前後に位置する高調波成分の振幅の平均値を振幅とする高調波成分を生成する、
    請求項7に記載の音響信号復号装置。
  9. 入力信号を低サンプリングレートにダウンサンプリングするダウンサンプリング部と、
    前記ダウンサンプリングされた信号をコア符号化パラメータへ符号化し、前記コア符号化パラメータを出力するとともに、前記コア符号化パラメータをローカルに復号し、復号された信号を周波数領域に変換して合成低周波数スペクトルを得るコア符号化部と、
    前記合成低周波数スペクトルを正規化するエネルギ正規化部と、
    前記入力信号をスペクトルに変換するとともに、前記合成低周波数スペクトルより高い周波数のスペクトルを複数のサブバンドに分割する時間−周波数変換部と、
    前記各サブバンドに対して、前記正規化された合成低周波数スペクトルから最も相関の高い部分を特定し、特定結果をインデックス情報として出力する類似度探索部と、
    前記各サブバンドと、前記合成低周波数スペクトルから特定された前記最も相関の高い部分との間のエネルギのスケールファクタを推定し、前記スケールファクタを、スケールファクタ情報として出力するスケールファクタ推定部と、
    前記合成低周波数スペクトルの高調波の周波数と、前記変換された入力信号の高調波の周波数を推定する高調波周波数推定部と、
    前記2つの高調波の周波数を比較して、高調波周波数調整をすべきか否かを判断し、前記判断結果をフラグ情報として出力する高調波周波数比較部と、
    前記コア符号化パラメータ、前記フラグ情報、前記インデックス情報、および前記スケ ールファクタ情報をビットストリームに統合する多重化部と、
    を具備する音響信号符号化装置。
  10. 入力信号を低サンプリングレートにダウンサンプリングするダウンサンプリング部と、
    前記ダウンサンプリングされた信号をコア符号化パラメータへ符号化し、前記コア符号 化パラメータを出力するとともに、前記コア符号化パラメータをローカルに復号し、復号された信号を周波数領域に変換して合成低周波数スペクトルを得るコア符号化部と、
    前記入力信号をスペクトルに変換するとともに、前記合成低周波数スペクトルより高い周波数のスペクトルを複数のサブバンドに分割する時間−周波数変換部と、
    前記各サブバンドに対して、前記合成低周波数スペクトルから最も相関の高い部分を特定し、特定結果をインデックス情報として出力する類似度探索部と、
    前記各サブバンドと、前記合成低周波数スペクトルから特定された前記最も相関の高い部分との間のエネルギのスケールファクタを推定し、前記スケールファクタをスケールファクタ情報として出力するスケールファクタ推定部と、
    前記コア符号化パラメータ、前記インデックス情報、および前記スケールファクタ情報 をビットストリームに統合する多重化部と、
    を具備する、音響信号符号化装置。
  11. 前記合成低周波数スペクトルの高調波の周波数と、前記変換された入力信号の高調波の 周波数を推定し、出力する高調波周波数推定部をさらに具備し、
    前記多重化部は、前記合成低周波数スペクトルの前記高調波周波数と、前記変換された 入力信号の高調波周波数をさらに統合するように構成される、請求項10に記載の音響信 号符号化装置。
  12. 符号化パラメータ、インデックス情報、およびスケールファクタ情報を含む符号化情報を受信するステップと、
    複製された高周波数サブバンドスペクトルを得るために、前記インデックス情報に基づき、合成低周波数スペクトルを用いて高周波数サブバンドスペクトルを複製するステップであって、前記合成低周波数スペクトルは前記符号化パラメータを復号することによって得られる、スペクトルを複製するステップと、
    前記スケールファクタ情報を用いて、前記複製された高周波数サブバンドスペクトルの振幅を調整するステップと、
    前記複製された高周波数サブバンドスペクトルにおける高調波成分の周波数を推定するステップと、
    前記合成低周波数スペクトルを用いて推定される高調波周波数を用いて前記複製された高周波数サブバンドスペクトルにおける高調波成分の周波数を調整するステップと、
    前記合成低周波数スペクトルと前記高調波成分の周波数が調整された前記複製された高周波数サブバンドスペクトルとを用いて出力信号を生成するステップと、
    を具備する、音響信号復号方法。
  13. 符号化パラメータと、インデックス情報と、スケールファクタ情報と、フラグ情報とを含む符号化情報を受信するステップと、
    複製された高周波数サブバンドスペクトルを得るために、合成低周波数スペクトルから、前記インデックス情報に基づいて高周波数サブバンドスペクトルを再構成するステップであって、前記合成低周波数スペクトルは前記符号化パラメータを復号して得られる、高周波数サブバンドスペクトルを再構成するステップと、
    前記スケールファクタ情報を用いて、前記複製された高周波数サブバンドスペクトルの振幅を調整するステップと、
    前記合成低周波数スペクトルから高調波の周波数を推定するステップと、
    前記推定された高調波の周波数に基づいて、前記合成低周波数スペクトルから前記複製された高周波数サブバンドスペクトルにおけるトーン成分の周波数を調整するステップと、
    前記フラグ情報に基づいて、トーン成分の周波数を調整するステップを動作させるか否かを決定するステップと、
    前記合成低周波数スペクトルと、前記高調波成分の周波数が調整された前記複製された高周波数サブバンドスペクトルを用いて出力信号を生成するステップと、
    を具備する、音響信号復号方法。
  14. 入力信号を低サンプリングレートにダウンサンプリングするステップと、
    合成低周波数スペクトルを得るために、前記ダウンサンプリングされた信号をコア符号化パラメータへ符号化し、前記コア符号化パラメータを出力するとともに、前記コア符号化パラメータをローカルに復号し、復号された信号を周波数領域に変換するステップと、
    前記合成低周波数スペクトルを正規化するステップと、
    前記入力信号をスペクトルに変換するとともに、前記合成低周波数スペクトルより高い周波数のスペクトルを複数のサブバンドに分割するステップと、
    前記各サブバンドに対して、前記正規化された合成低周波数スペクトルから最も相関の高い部分を特定し、特定結果をインデックス情報として出力するステップと、
    前記各サブバンドと、前記合成低周波数スペクトルから特定された前記最も相関の高い部分との間のエネルギのスケールファクタを推定し、前記スケールファクタを、スケールファクタ情報として出力するステップと、
    前記合成低周波数スペクトルの高調波の周波数と、前記変換された入力信号の高調波の周波数を推定するステップと、
    前記2つの高調波の周波数を比較して、高調波周波数調整をすべきか否かを判断し、前記判断結果をフラグ情報として出力するステップと、
    を具備する、音響信号符号化方法。
  15. 入力信号を低サンプリングレートにダウンサンプリングするステップと、
    合成低周波数スペクトルを得るために、前記ダウンサンプリングされた信号をコア符号化パラメータへ符号化し、前記コア符号化パラメータを出力するとともに、前記コア符号化パラメータを復号し、前記復号された信号を周波数領域に変換するステップと、
    前記入力信号をスペクトルに変換するとともに、前記合成低周波数スペクトルより高い周波数のスペクトルを複数のサブバンドに分割するステップと、
    前記各サブバンドに対して、前記合成低周波数スペクトルから最も相関の高い部分を特定し、特定結果をインデックス情報として出力するステップと、
    前記各サブバンドと、前記合成低周波数スペクトルから特定された前記最も相関の高い部分との間のエネルギのスケールファクタを推定し、前記スケールファクタをスケールファクタ情報として出力するステップと、
    前記合成低周波数スペクトルの高調波の周波数と、前記変換された入力信号の高調波の周波数を推定し、出力するステップと、
    を具備する、音響信号符号化方法。
  16. 入力信号を低サンプリングレートにダウンサンプリングするステップと、
    合成低周波数スペクトルを得るために、前記ダウンサンプリングされた信号をコア符号 化パラメータへ符号化し、前記コア符号化パラメータを出力するとともに、前記コア符号 化パラメータを復号し、前記復号された信号を周波数領域に変換するステップと、
    前記入力信号をスペクトルに変換するともに、前記合成低周波数スペクトルより高い周 波数のスペクトルを複数のサブバンドに分割するステップと、
    前記各サブバンドに対して、前記合成低周波数スペクトルから最も相関の高い部分を特 定し、特定結果をインデックス情報として出力するステップと、
    前記各サブバンドと、前記合成低周波数スペクトルから特定された前記最も相関の高い 部分との間のエネルギのスケールファクタを推定し、前記スケールファクタをスケールフ ァクタ情報として出力するステップと、
    前記コア符号化パラメータ、前記インデックス情報、および前記スケールファクタ情報 をビットストリームに統合するステップと、
    を具備する、音響信号符号化方法。
  17. コンピュータまたはプロセッサにおいて実行する場合に、求項12、請求項13、請求項14、請求項15または請求項16のいずれかの一つの方法を実行するためのコンピュータプログラムを格納する非一時的記憶媒体。
JP2018173725A 2013-06-11 2018-09-18 音響信号の帯域幅拡張を行う装置及び方法 Active JP6773737B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020166633A JP7330934B2 (ja) 2013-06-11 2020-10-01 音響信号の帯域幅拡張を行う装置及び方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013122985 2013-06-11
JP2013122985 2013-06-11

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015522543A Division JP6407150B2 (ja) 2013-06-11 2014-06-10 音響信号の帯域幅拡張を行う装置及び方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2020166633A Division JP7330934B2 (ja) 2013-06-11 2020-10-01 音響信号の帯域幅拡張を行う装置及び方法

Publications (2)

Publication Number Publication Date
JP2019008316A JP2019008316A (ja) 2019-01-17
JP6773737B2 true JP6773737B2 (ja) 2020-10-21

Family

ID=52021944

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2015522543A Active JP6407150B2 (ja) 2013-06-11 2014-06-10 音響信号の帯域幅拡張を行う装置及び方法
JP2018173725A Active JP6773737B2 (ja) 2013-06-11 2018-09-18 音響信号の帯域幅拡張を行う装置及び方法
JP2018173731A Pending JP2019008317A (ja) 2013-06-11 2018-09-18 音響信号の帯域幅拡張を行う装置及び方法
JP2020166633A Active JP7330934B2 (ja) 2013-06-11 2020-10-01 音響信号の帯域幅拡張を行う装置及び方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2015522543A Active JP6407150B2 (ja) 2013-06-11 2014-06-10 音響信号の帯域幅拡張を行う装置及び方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2018173731A Pending JP2019008317A (ja) 2013-06-11 2018-09-18 音響信号の帯域幅拡張を行う装置及び方法
JP2020166633A Active JP7330934B2 (ja) 2013-06-11 2020-10-01 音響信号の帯域幅拡張を行う装置及び方法

Country Status (11)

Country Link
US (4) US9489959B2 (ja)
EP (2) EP3731226A1 (ja)
JP (4) JP6407150B2 (ja)
KR (1) KR102158896B1 (ja)
CN (2) CN111477245A (ja)
BR (2) BR112015029574B1 (ja)
ES (1) ES2836194T3 (ja)
MX (1) MX353240B (ja)
PT (1) PT3010018T (ja)
RU (2) RU2658892C2 (ja)
WO (1) WO2014199632A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021002069A (ja) * 2013-06-11 2021-01-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音響信号の帯域幅拡張を行う装置及び方法

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103516440B (zh) * 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
CN103971693B (zh) * 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
CN105874534B (zh) * 2014-03-31 2020-06-19 弗朗霍弗应用研究促进协会 编码装置、解码装置、编码方法、解码方法及程序
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
CN105280189B (zh) * 2015-09-16 2019-01-08 深圳广晟信源技术有限公司 带宽扩展编码和解码中高频生成的方法和装置
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
US10346126B2 (en) 2016-09-19 2019-07-09 Qualcomm Incorporated User preference selection for audio encoding
JP6769299B2 (ja) * 2016-12-27 2020-10-14 富士通株式会社 オーディオ符号化装置およびオーディオ符号化方法
EP3396670B1 (en) * 2017-04-28 2020-11-25 Nxp B.V. Speech signal processing
US10896684B2 (en) 2017-07-28 2021-01-19 Fujitsu Limited Audio encoding apparatus and audio encoding method
CN111386568B (zh) 2017-10-27 2023-10-13 弗劳恩霍夫应用研究促进协会 使用神经网络处理器生成带宽增强的音频信号的装置、方法或计算机可读存储介质
CN108630212B (zh) * 2018-04-03 2021-05-07 湖南商学院 非盲带宽扩展中高频激励信号的感知重建方法与装置
CN110660409A (zh) * 2018-06-29 2020-01-07 华为技术有限公司 一种扩频的方法及装置
US11100941B2 (en) * 2018-08-21 2021-08-24 Krisp Technologies, Inc. Speech enhancement and noise suppression systems and methods
CN109243485B (zh) * 2018-09-13 2021-08-13 广州酷狗计算机科技有限公司 恢复高频信号的方法和装置
JP6693551B1 (ja) * 2018-11-30 2020-05-13 株式会社ソシオネクスト 信号処理装置および信号処理方法
CN113192517B (zh) * 2020-01-13 2024-04-26 华为技术有限公司 一种音频编解码方法和音频编解码设备
CN114550732B (zh) * 2022-04-15 2022-07-08 腾讯科技(深圳)有限公司 一种高频音频信号的编解码方法和相关装置

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
DE60230856D1 (de) * 2001-07-13 2009-03-05 Panasonic Corp Audiosignaldecodierungseinrichtung und audiosignalcodierungseinrichtung
DE602004021266D1 (de) * 2003-09-16 2009-07-09 Panasonic Corp Kodier- und dekodierapparat
US7949057B2 (en) 2003-10-23 2011-05-24 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
US7668711B2 (en) * 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
CN101656077B (zh) * 2004-05-14 2012-08-29 松下电器产业株式会社 音频编码装置、音频编码方法以及通信终端和基站装置
EP1798724B1 (en) * 2004-11-05 2014-06-18 Panasonic Corporation Encoder, decoder, encoding method, and decoding method
JP4899359B2 (ja) * 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US20070299655A1 (en) * 2006-06-22 2007-12-27 Nokia Corporation Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech
US8560328B2 (en) * 2006-12-15 2013-10-15 Panasonic Corporation Encoding device, decoding device, and method thereof
US9082397B2 (en) 2007-11-06 2015-07-14 Nokia Technologies Oy Encoder
CN101471072B (zh) * 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
WO2010028297A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
US9037474B2 (en) * 2008-09-06 2015-05-19 Huawei Technologies Co., Ltd. Method for classifying audio signal into fast signal or slow signal
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
EP2224433B1 (en) 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
CN101751926B (zh) 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
CA3231911A1 (en) * 2009-01-16 2010-07-22 Dolby International Ab Cross product enhanced harmonic transposition
US8983831B2 (en) 2009-02-26 2015-03-17 Panasonic Intellectual Property Corporation Of America Encoder, decoder, and method therefor
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
CN102598123B (zh) * 2009-10-23 2015-07-22 松下电器(美国)知识产权公司 编码装置、解码装置及其方法
US20130030796A1 (en) * 2010-01-14 2013-01-31 Panasonic Corporation Audio encoding apparatus and audio encoding method
WO2011155170A1 (ja) * 2010-06-09 2011-12-15 パナソニック株式会社 帯域拡張方法、帯域拡張装置、プログラム、集積回路およびオーディオ復号装置
KR101709095B1 (ko) * 2010-07-19 2017-03-08 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP5707842B2 (ja) * 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
HUE062540T2 (hu) * 2011-02-18 2023-11-28 Ntt Docomo Inc Beszédkódoló és beszédkódolási eljárás
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
US9384749B2 (en) * 2011-09-09 2016-07-05 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, encoding method and decoding method
JP2013122985A (ja) 2011-12-12 2013-06-20 Toshiba Corp 半導体記憶装置
ES2836194T3 (es) * 2013-06-11 2021-06-24 Fraunhofer Ges Forschung Dispositivo y procedimiento para la extensión de ancho de banda para señales acústicas

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021002069A (ja) * 2013-06-11 2021-01-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音響信号の帯域幅拡張を行う装置及び方法
JP7330934B2 (ja) 2013-06-11 2023-08-22 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音響信号の帯域幅拡張を行う装置及び方法

Also Published As

Publication number Publication date
EP3731226A1 (en) 2020-10-28
RU2658892C2 (ru) 2018-06-25
BR122020016403B1 (pt) 2022-09-06
JPWO2014199632A1 (ja) 2017-02-23
US20160111103A1 (en) 2016-04-21
BR112015029574A2 (pt) 2017-07-25
JP2019008317A (ja) 2019-01-17
CN105408957B (zh) 2020-02-21
WO2014199632A1 (ja) 2014-12-18
US9489959B2 (en) 2016-11-08
JP7330934B2 (ja) 2023-08-22
MX2015016109A (es) 2016-10-26
PT3010018T (pt) 2020-11-13
BR112015029574B1 (pt) 2021-12-21
EP3010018B1 (en) 2020-08-12
US9747908B2 (en) 2017-08-29
KR102158896B1 (ko) 2020-09-22
JP2019008316A (ja) 2019-01-17
CN111477245A (zh) 2020-07-31
EP3010018A4 (en) 2016-06-15
RU2018121035A (ru) 2019-03-05
US10157622B2 (en) 2018-12-18
MX353240B (es) 2018-01-05
JP2021002069A (ja) 2021-01-07
US20170025130A1 (en) 2017-01-26
CN105408957A (zh) 2016-03-16
JP6407150B2 (ja) 2018-10-17
ES2836194T3 (es) 2021-06-24
RU2018121035A3 (ja) 2019-03-05
RU2688247C2 (ru) 2019-05-21
RU2015151169A (ru) 2017-06-05
US10522161B2 (en) 2019-12-31
RU2015151169A3 (ja) 2018-03-02
EP3010018A1 (en) 2016-04-20
KR20160018497A (ko) 2016-02-17
US20170323649A1 (en) 2017-11-09
US20190122679A1 (en) 2019-04-25

Similar Documents

Publication Publication Date Title
JP6773737B2 (ja) 音響信号の帯域幅拡張を行う装置及び方法
US7356748B2 (en) Partial spectral loss concealment in transform codecs
US10984810B2 (en) Noise filling without side information for CELP-like coders
JP2004512561A (ja) 符号化音響信号の復号に関するエラー隠匿
EP1697927B1 (en) Improved frequency-domain error concealment
AU2014211529B2 (en) Apparatus and method for generating a frequency enhancement signal using an energy limitation operation
US9117461B2 (en) Coding device, decoding device, coding method, and decoding method for audio signals
AU2015295624B2 (en) Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
JP2004206129A (ja) 時間−周波数相関性を利用した改善されたオーディオ符号化及び/または復号化方法とその装置
US20130006644A1 (en) Method and device for spectral band replication, and method and system for audio decoding
Lin et al. Adaptive bandwidth extension of low bitrate compressed audio based on spectral correlation
JP2013019968A (ja) 周波数帯コピー方法、装置及びオーディオ復号化方法、システム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181016

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A132

Effective date: 20200107

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200326

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201001

R150 Certificate of patent or registration of utility model

Ref document number: 6773737

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250