JP2008535027A - 高帯域励振生成のためのシステム、方法、及び装置 - Google Patents

高帯域励振生成のためのシステム、方法、及び装置 Download PDF

Info

Publication number
JP2008535027A
JP2008535027A JP2008504481A JP2008504481A JP2008535027A JP 2008535027 A JP2008535027 A JP 2008535027A JP 2008504481 A JP2008504481 A JP 2008504481A JP 2008504481 A JP2008504481 A JP 2008504481A JP 2008535027 A JP2008535027 A JP 2008535027A
Authority
JP
Japan
Prior art keywords
signal
band
excitation signal
highband
weighting factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008504481A
Other languages
English (en)
Other versions
JP4955649B2 (ja
Inventor
フォス、コエン・ベルナルト
カンドハダイ、アナンサパドマナブハン・エー.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36588741&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2008535027(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2008535027A publication Critical patent/JP2008535027A/ja
Application granted granted Critical
Publication of JP4955649B2 publication Critical patent/JP4955649B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

【解決手段】1つの実施形態では、高帯域励振信号を生成する方法は、低帯域励振信号に基づく信号のスペクトルを高調波拡張することと、低帯域励振信号に基づく信号の時間領域エンベロープを計算することと、時間領域エンベロープに従って雑音信号を変調することとを含む。この方法は更に、(A)高調波拡張の結果に基づく高調波拡張信号と、(B)変調の結果に基づく変調雑音信号とを結合することを含む。この方法では、高帯域励振信号は、この結合の結果に基づく。
【選択図】 図1a

Description

本発明は、信号処理に関する。
関連出願
本出願は、2005年4月1日に出願した「CODING THE HIGH−FREQUENCY BAND OF WIDEBAND SPEECH」という表題の米国仮特許出願第60/667,901号の利益を主張するものである。本出願は、また、2005年4月22日に出願した「PARAMETER CODING IN A HIGH−BAND SPEECH CODER」という表題の米国仮特許出願第60/673,965号の利益を主張するものである。
公衆交換電話網(PSTN)による音声通信は、従来、帯域幅を300〜3400kHzの周波数範囲に制限されていた。セルラ電話およびボイスオーバーIP(インターネットプロトコル、VoIP)などの音声通信のための新しいネットワークは、同じ帯域幅限界を有しているとは限らず、このようなネットワーク上では広帯域の周波数範囲を含む音声通信の送受信を行うことが望ましいと思われる。例えば、下は50Hzまで、および/または上は7または8kHzまでの音声周波数範囲に対応できることが望ましいであろう。また、従来のPSTNの限界を外れた範囲にある音声コンテンツを含みうる高品質オーディオまたはオーディオ/ビデオ会議などの他の用途にも対応できることが望ましいと考えられる。
音声コーダが対応する範囲をより高い周波数にまで拡大すると、明瞭度を改善できる。例えば、「s」や「f」などの摩擦音を区別する情報は、もっぱら高い周波数にある。また、高帯域まで拡大できれば、存在感などの他の音声品質も改善できる。例えば、有声母音であっても、PSTN限界をはるかに超えるスペクトルエネルギーを有する場合がある。
広帯域音声符号化の1つのアプローチとして、狭帯域音声符号化技術(例えば、0〜4kHzの周波数範囲を符号化するように構成された技術)を広帯域スペクトルに対応できるように拡張する方法もある。例えば、音声信号は、高い周波数の成分を含むように高レートでサンプリングされ、狭帯域符号化技術は、さらに多くのフィルタ係数を使用してこの広帯域信号を表現できるように再構成されうる。しかし、CELP(符号帳励振線形予測)などの狭帯域符号化技術は、大量の計算を必要とし、広帯域CELPコーダは、非常に多くの処理サイクルを消費するので、多くのモバイルアプリケーションおよび他の組み込み型アプリケーションには実用的でない場合がある。このような技術を使用して広帯域信号のスペクトル全体を所望の品質となるように符号化した場合も、帯域幅は許容できないほどの大きさとなりうる。さらに、このような符号化された信号のトランスコーディングは、その狭帯域部分が狭帯域符号化にしか対応していないシステムに伝送され、かつ/またはそのシステムによって復号される場合であってもその前に必要になる。
広帯域音声符号化に対するもう1つのアプローチでは、符号化されている狭帯域スペクトルエンベロープから高帯域スペクトルエンベロープに外挿する必要がある。このようなアプローチは、帯域幅を拡大することなく、またトランスコーディングを行う必要なく実装することができるが、音声信号の高帯域部分の粗スペクトルエンベロープまたはホルマント構造は、一般的に、狭帯域部分のスペクトルエンベロープから正確に予測できない。
トランスコーディングまたは他の著しい修正を行うことなく、符号化された信号の少なくとも狭帯域部分が狭帯域チャネル(PSTNチャネルなど)を通して送信されるように広帯域音声符号化を実装することが望ましいと考えられる。広帯域符号化拡張の効率のよさも、例えば、無線携帯電話ならびに有線および無線チャネルを介した一斉同報型通信などの用途においてサービスを提供できるユーザーの数を著しく減らさないためにも望ましいと考えられる。
米国仮特許出願第60/667,901号 米国仮特許出願第60/673,965号 特許出願(整理番号050551)「SYSTEMS,METHODS,AND APPARATUS FOR SPEECH SIGNAL FILTERING」 米国特許出願公開第2004/0098255号 米国特許第5,704,003号 米国特許第6,879,955号
1つの実施形態では、高帯域励振信号を生成する方法は、低帯域励振信号に基づく信号のスペクトルを高調波拡張することと、低帯域励振信号に基づく信号の時間領域エンベロープを計算することと、時間領域エンベロープに従って雑音信号を変調することとを含む。この方法はまた、(A)高調波拡張の結果に基づく高調波拡張信号と、(B)変調の結果に基づく変調雑音信号とを結合することを含む。この方法では、高帯域励振信号は、この結合の結果に基づく。
別の実施形態では、装置は、低帯域励振信号に基づく信号のスペクトルの高調波拡張を行なうように構成されたスペクトル拡張器と、低帯域励振信号に基づく信号の時間領域エンベロープを計算するように構成されたエンベロープ計算器と、時間領域エンベロープに従って雑音信号の変調を行なうように構成された第1の結合器と、(A)高調波拡張の結果に基づく高調波拡張信号と、(B)変調の結果に基づく変調雑音信号との合計を計算するように構成された第2の結合器とを含む。高帯域励振信号は、この合計の結果に基づく。
別の実施形態では、装置は、低帯域励振信号に基づく信号のスペクトルを高調波拡張する手段と、低帯域励振信号に基づく信号の時間領域エンベロープを計算する手段と、時間領域エンベロープに従って雑音信号を変調する手段と、(A)高調波拡張の結果に基づく高調波拡張信号と、(B)変調の結果に基づく変調雑音信号とを結合する手段とを含む。この装置では、高帯域励振信号は、この結合の結果に基づく。
別の実施形態では、高帯域励振信号を生成する方法は、音声信号の低周波部分から導かれる低帯域励振信号に非線形関数を適用することによって、高調波拡張信号を計算することと、高調波拡張信号を変調雑音信号と混合して、高帯域励振信号を生成することを含む。
図面および随伴する説明において、同じ参照符号は、同じまたは類似の要素もしくは信号を指している。
本明細書で説明されているような実施形態は、わずか800から1000bps(ビット/秒)程度の帯域幅拡大で広帯域音声信号の伝送および/または記憶に対応できるように狭帯域音声コーダの拡張を行う構成をとることができるシステム、方法、および装置を含む。このような実装の利点として考えられるのは、狭帯域システムとの互換性を維持するための埋め込み符号化、比較的容易な割り当て、および狭帯域符号化チャネルと高帯域符号化チャネルとの間のビットの再割り当て、大量の計算を必要とする広帯域合成演算の回避、および大量の計算を必要とする波形符号化ルーチンにより処理される信号の低サンプリングレートの維持などである。
特に断り書きのない限り、「計算(する)」という用語は、本明細書では、計算、生成、および値のリストからの選択などの通常の意味のいずれかを示すために使用される。「含む、備える」という用語が本明細書および請求項の中で使用される場合、他の要素または演算は除外されない。「Aは、Bに基づく」という言いまわしは、(i)「AはBに等しい」という場合および(ii)「Aは、少なくともBに基づく」という場合を含む、その通常の意味のいずれかを示すために使用される。「インターネットプロトコル」という用語は、IETF(インターネットエンジニアリングタスクフォース)RFC(Request for Comments)791で説明されているようなバージョン4、およびバージョン6などのそれ以降のバージョンを含む。
図1aは、一実施形態による広帯域音声符号器A100のブロック図を示す。フィルタバンクA110は、高帯域音声信号S10をフィルタ処理して、狭帯域信号S20および高帯域信号S30を出力するように構成される。狭帯域符号器A120は、狭帯域信号S20を符号化して、狭帯域(NB)フィルタパラメータS40および狭帯域残留信号S50を生成するように構成される。本明細書でさらに詳しく説明されるように、狭帯域符号器A120は、典型的には、狭帯域フィルタパラメータS40および符号化された狭帯域励振信号S50を符号帳インデックスとして、または他の量子化形式で生成するように構成される。高帯域符号器A200は、符号化された狭帯域励振信号S50に含まれる情報に従って高帯域信号S30を符号化し、高帯域符号化パラメータS60を生成するように構成される。本明細書でさらに詳しく説明されるように、高帯域符号器A200は、典型的には、高帯域符号化パラメータS60を符号帳インデックスとして、または他の量子化形式で生成するように構成される。広帯域音声符号器A100の特定の一例は、広帯域音声信号S10を約8.55kbs(キロビット/秒)の速度で符号化するように構成され、その際に、狭帯域フィルタパラメータS40および符号化された狭帯域励振信号S50に約7.55kbps、高帯域符号化パラメータS60に約1kbpsが使用される。
符号化された狭帯域および高帯域信号を組み合わせて単一のビットストリームを形成するのが望ましい場合がある。例えば、符号化された広帯域音声信号として、送信(例えば、有線伝送チャネル、光伝送チャネル、または無線伝送チャネル)用または記憶用に符号化された信号を多重化することが望ましい場合がある。図1bは、狭帯域フィルタパラメータS40、符号化された狭帯域励振信号S50、および高帯域フィルタパラメータS60を組み合わせて多重化された1つの信号S70にまとめるように構成された多重化装置を備える広帯域音声符号器A100の一実装A102のブロック図を示している。
符号器A102を備える装置は、さらに、多重化された信号S70を有線チャネル、光チャネル、または無線チャネルなどの伝送チャネルに伝送するように構成された回路を備えることができる。このような装置は、さらに、誤り訂正符号化(例えば、可変レート畳み込み符号化)および/または誤り検出符号化(例えば、巡回冗長符号化)、および/またはネットワークプロトコル符号化の1つまたは複数の層(例えば、イーサネット(登録商標)、TCP/IP、cdma2000)などの1つまたは複数のチャネル符号化演算を信号に対し実行するように構成することもできる。
符号化された狭帯域信号(狭帯域フィルタパラメータS40および符号化された狭帯域励振信号S50を含む)を多重化された信号S70の分離可能な部分ストリームとして埋め込み、広帯域および/または低帯域信号などの多重化された信号S70の他の部分とは独立に復元、復号できるように、多重化装置A130を構成することが望ましいと思われる。例えば、多重化された信号S70は、高帯域フィルタパラメータS60を剥ぎ取ることにより、符号化された狭帯域信号が復元されるように構成できる。このような機能の利点の1つとして、狭帯域信号の復号には対応できるが、高帯域部分の復号には対応できないシステムに符号化された広帯域信号を渡すのに先立って、その符号化された広帯域信号をトランスコードする必要がなくなる点が挙げられる。
図2aは、一実施形態による広帯域音声復号器B100のブロック図である。狭帯域復号器B110は、狭帯域フィルタパラメータS40および符号化された狭帯域励振信号S50を復号し、狭帯域信号S90を生成するように構成される。高帯域復号器B200は、符号化された狭帯域励振信号S50に基づく狭帯域励振信号S80に従って高帯域符号化パラメータS60を復号し、高帯域信号S100を生成するように構成される。この例では、狭帯域復号器B110は、狭帯域励振信号S80を高帯域復号器B200に供給するように構成される。フィルタバンクB120は、狭帯域信号S90と高帯域信号S100を組み合わせて、広帯域音声信号をS110を生成するように構成される。
図2bは、符号化された信号S40、S50、およびS60を、多重化された信号S70から生成するように構成された逆多重化装置B130を備える広帯域音声復号器B100の一実装B102のブロック図である。復号器B102を備える装置は、多重化された信号S70を有線チャネル、光チャネル、または無線チャネルなどの伝送チャネルから受信するように構成された回路を備えることができる。このような装置は、さらに、誤り訂正復号(例えば、可変レート畳み込み復号)および/または誤り検出復号(例えば、巡回冗長復号)、および/またはネットワークプロトコル復号の1つまたは複数の層(例えば、イーサネット、TCP/IP、cdma2000)などの1つまたは複数のチャネル復号演算を信号に対し実行するように構成することもできる。
フィルタバンクA110は、帯域分割方式により入力信号をフィルタ処理し、低周波サブバンドと高周波サブバンドを生成するように構成される。特定の用途の設計基準に応じて、出力サブバンドは、等しい帯域幅または等しくない帯域幅を有し、重なる場合も重ならない場合もある。3つ以上のサブバンドを生成するフィルタバンクA110の構成も可能である。例えば、このようなフィルタバンクは、狭帯域信号S20の範囲よりも低い周波数範囲(例えば、50〜300Hzの範囲など)の成分を含む1つまたは複数の低帯域信号を生成するように構成することができる。また、このようなフィルタバンクは、高帯域信号S30の範囲よりも高い周波数範囲(例えば、14〜20、16〜20、または16〜32kHzの範囲など)の成分を含む1つまたは複数の追加高帯域信号を生成するように構成することも可能である。このような場合、広帯域音声符号器A100は、この1つまたは複数の信号を別々に符号化するように実装することができ、また多重化装置A130は、追加の符号化された1つまたは複数の信号を多重化された信号S70に(例えば、分離可能な部分として)含めるように構成することができる。
図3aは、サンプリングレートを下げた2つのサブバンド信号を生成するように構成されたフィルタバンクA110の一実装A112のブロック図を示している。フィルタバンクA110は、高周波(高帯域)部分と低周波(低帯域)部分とを有する広帯域音声信号S10を受信するように構成される。フィルタバンクA112は、広帯域音声信号S10を受信し、狭帯域音声信号S20を生成するように構成された低帯域処理経路、および広帯域音声信号S10を受信し、高帯域音声信号S30を生成するように構成された高帯域処理経路を備える。ローパスフィルタ110は、広帯域音声信号S10をフィルタ処理して選択された低周波サブバンドを通し、ハイパスフィルタ130は、広帯域音声信号S10をフィルタ処理して選択された高周波サブバンドを通す。サブバンド信号は両方とも、広帯域音声信号S10よりも狭い帯域幅を有するため、そのサンプリングレートは、情報を失うことなく、ある程度下げることができる。ダウンサンプラ120は、所望のデシメーション係数によりローパス信号のサンプリングレートを下げ(例えば、信号のサンプルを除去し、および/またはサンプルを平均値で置き換えることにより)、ダウンサンプラ140も、同様に、他の所望のデシメーション係数によりハイパス信号のサンプリングレートを下げる。
図3bは、フィルタバンクB120の対応する一実装B122のブロック図を示している。アップサンプラ150は、狭帯域信号S90のサンプリングレートを上げ(例えば、ゼロ詰めにより、および/またはサンプルの複製により)、ローパスフィルタ160は、アップサンプリングされた信号をフィルタ処理し、低帯域部分のみを通す(例えば、エイリアシングを防ぐため)。同様に、アップサンプラ170は、高帯域信号S100のサンプリングレートを上げ、ハイパスフィルタ180は、アップサンプリングされた信号をフィルタ処理して、高帯域部分のみを通す。次いで、2つの通過帯域信号を加算して、広帯域音声信号S110を形成する。復号器B100のいくつかの実装では、フィルタバンクB120は、高帯域復号器B200により受信された、および/または計算された1つ複数の重みに応じて2つの通過帯域信号の加重和を生成するように構成される。3つ以上の通過帯域信号を組み合わせたフィルタバンクB120の構成も考えられる。
フィルタ110、130、160、180はそれぞれ、有限インパルス応答(FIR)フィルタまたは無限インパルス応答(IIR)フィルタとして実装することができる。符号器フィルタ110および130の周波数応答は、阻止帯域と通過帯域との間の対称的な、または異形の遷移領域を形成しうる。同様に、復号器フィルタ160および180の周波数応答は、阻止帯域と通過帯域との間の対称的な、または異形の遷移領域を形成しうる。ローパスフィルタ110は、ローパルフィルタ160と同じ応答を有し、ハイパスフィルタ130は、ハイパスフィルタ180と同じ応答を有することが望ましいが、厳密に必要というわけではない。一例では、2つのフィルタペア110、130および160、180は、直交ミラーフィルタ(QMF)バンクであり、フィルタペア110、130は、フィルタペア160、180と同じ係数を有する。
典型的な例では、ローパスフィルタ110は、300〜3400HzのPSTNの制限された範囲(例えば、0から4kHzまでの帯域)を含む通過帯域を有する。図4aおよび4bは、2つの異なる実装例における広帯域音声信号S10、狭帯域信号S20、および高帯域信号S30の相対的帯域幅を示している。これら両方の特定の例では、広帯域音声信号S10は、16kHzのサンプリングレート(0から8kHzまでの範囲内の周波数成分を表す)を有し、狭帯域信号S20は、8kHzのサンプリングレート(0から4kHzの範囲内の周波数成分を表す)を有する。
図4aの例では、2つのサブバンド間に著しい重なりはない。この例で示されているような高帯域信号S30は、4〜8kHzの通過帯域を有するハイパスフィルタ130を使用して得られる。このような場合、フィルタ処理された信号に対し2倍のダウンサンプリングを実行することでサンプリングレートを8kHzに下げることが望ましいと思われる。信号に対するさらなる処理演算の計算複雑度を著しく減じると予測できるこのような演算により、通過帯域エネルギーは、情報を失うことなく0から4kHzまでの範囲に下げられる。
図4bの他の例では、上側および下側サブバンドには、かなりの重なりがあり、3.5から4kHzまでの領域が、両方のサブバンド信号により表現される。この例で示されているような高帯域信号S30は、3.5〜7kHzの通過帯域を有するハイパスフィルタ130を使用して得られる。このような場合、フィルタ処理された信号に対し16/7のダウンサンプリングを実行することでサンプリングレートを7kHzに下げることが望ましいと思われる。信号に対するさらなる処理演算の計算複雑度を著しく減じると予測できるこのような演算により、通過帯域エネルギーは、情報を失うことなく0から3.5kHzまでの範囲に下げられる。
電話通信に使われる典型的な送受話器では、トランスデューサ(つまり、マイクおよびイヤホンもしくはスピーカー)の1つまたは複数は、7〜8kHzの周波数範囲にわたって感知されうる応答を欠いている。図4bの例では、7から8kHzまでの広帯域音声信号S10の部分は、符号化された信号の中に含まれない。ハイパスフィルタ130の他の特定の例は、3.5〜7.5kHzおよび3.5〜8kHzの通過帯域を有する。
いくつかの実装では、図4bの例のようなサブバンド間に重なりを設けることで、重なり合う領域全体にわたって滑らかなロールオフを有するローパスおよび/またはハイパスフィルタを使用することができる。このようなフィルタは、典型的には、鋭い応答、またはブリックウォール型応答を持つフィルタに比べて、設計しやすく、計算複雑度が低く、および/または入り込む遅延が小さい。鋭い遷移領域を有するフィルタは、滑らかなロールオフを持つ同様の次数フィルタに比べて高いサイドローブ(エイリアシングを引き起こす可能性がある)を有する傾向がある。鋭い遷移領域を有するフィルタは、さらに、リンギングアーチファクトの原因となりうる長いインパルス応答も持つ可能性がある。1つまたは複数のIIRフィルタを有するフィルタバンクについては、重なり合う領域上で滑らかなロールオフを行えると、極が単位円から遠く離れている1つまたは複数のフィルタを使用することが可能になるが、これは、安定した固定小数点実装を保証するうえで重要なことと考えられる。
サブバンドを重ね合わせることで、低帯域と高帯域の滑らかなブレンドが可能になり、その結果、可聴アーチファクトが減り、エイリアシングも低減され、および/または1つの帯域から他の帯域への遷移があまり目立たなくなる。さらに、狭帯域符号器A120(例えば、波形コーダ)の符号化効率は、周波数が高くなるとともに減少しうる。例えば、狭帯域コーダの符号化品質は、特に背景雑音が存在する場合に、低ビットレートで低下しうる。このような場合、サブバンドの重なりを与えることにより、重なり合う領域内の再現周波数成分の品質を高めることができる。
さらに、サブバンドを重ね合わせることで、低帯域と高帯域の滑らかなブレンドが可能になり、その結果、可聴アーチファクトが減り、エイリアシングも低減され、および/または1つの帯域から他の帯域への遷移があまり目立たなくなる。このような機能は、狭帯域符号器A120および高帯域符号器A200が異なる符号化方法により動作する実装には特に望ましいと思われる。例えば、符号化技術が異なれば、かなり異なる音を出す信号を発生しうる。符号帳インデックスの形式でスペクトルエンベロープを符号化するコーダは、代わりに振幅を符号化するコーダと異なる音を有する信号を発生しうる。時間領域コーダ(例えば、パルス符号変調またはPCMコーダ)は、周波数領域コーダと異なる音を有する信号を発生することができる。スペクトルエンベロープの表現および対応する残留信号とともに信号を符号化するコーダは、スペクトルエンベロープの表現のみで信号を符号化するコーダと異なる音を有する信号を発生することができる。信号をその波形の表現として符号化するコーダは、正弦波コーダとは異なる音を有する出力を発生することができる。このような場合、重なり合わないサブバンドを定義するために鋭い遷移領域を有するフィルタを使用すると、合成された広帯域信号のサブバンド間に急激な、はっきり認識できる遷移が生じうる。
重なり合う相補的周波数応答を有するQMFフィルタバンクは、サブバンド技術で使用されることが多いが、このようなフィルタは、本明細書で説明されている広帯域符号化実装の少なくとも一部については不適である。符号器のところにあるQMFフィルタバンクは、復号器のところにある対応するQMFフィルタバンクにおいてキャンセルされるかなりの程度のエイリアシングを発生するように構成される。このような構成は、フィルタバンク間で信号にかなりの量のひずみが生じる用途に使われる場合、ひずみのせいでキャンセレーション特性の有効性が減じうるため、適さないことがある。例えば、本明細書で説明されている用途としては、非常に低いビットレートで動作するように構成される符号化実装がある。ビットレートが非常に低いため、復号された信号は、元の信号と比べて著しくゆがんでいるように見える可能性があり、したがって、QMFフィルタバンクを使用すると、エイリアシングがキャンセルされない場合がある。QMFフィルタバンクを使用する用途では、より高いビットレートが使用される(例えば、AMRでは12kbps超、G.722では64kbps)。
さらに、コーダは、元の信号と知覚的には類似しているが、元の信号と実際には著しく異なる合成信号を発生するように構成されうる。例えば、本明細書で説明されているように狭帯域残留信号から高帯域励振信号を導出するコーダは、実際の高帯域残留信号が復号された信号に含まれない可能性があるので、そのような信号を発生させることができる。このような用途でQMFフィルタバンクを使用した場合、キャンセルされないエイリアシングによりかなりのひずみが発生しうる。
エイリアシングの効果は、サブバンドの幅に等しい帯域幅に制限されるため、QMFエイリアシングにより引き起こされるひずみの量は、影響を受けるサブバンドが狭い場合に低減されうる。しかし、本明細書で説明されているように、それぞれのサブバンドが広帯域の帯域幅の約半分を含む例では、キャンセルされないエイリアシングにより引き起こされるひずみは、信号のかなりの部分に影響を及ぼすおそれがある。信号の品質は、さらに、キャンセルされないエイリアシングが生じる周波数帯域の位置の影響を受ける可能性がある。例えば、広帯域音声信号の中心近く(例えば、3から4kHzの間)に生じるひずみは、信号のエッジの近く(例えば、6kHzよりも上)に生じるひずみに比べていっそう好ましくない場合がある。
QMFフィルタバンクのフィルタの応答は、相互に正確に関係しているが、フィルタバンクA110およびB120の低帯域および高帯域経路は、2つのサブバンドの重なりとは別に完全に無関係なスペクトルを持つように構成することができる。ここでは、2つのサブバンドの重なりを、高帯域フィルタの周波数応答が−20dBに低下する位置から低帯域フィルタの周波数応答が−20dBに低下する位置までの距離として定義する。フィルタバンクA110および/またはB120のさまざまな例において、この重なりは、約200Hzから約1kHzまでの範囲にある。約400から約600Hzまでの範囲は、符号化効率と知覚的滑らかさとの間の望ましいトレードオフの関係を表しうる。上で述べたような特定の一例では、この重なりは、約500Hzである。
フィルタバンクA112および/またはB122を、複数の段階にわけて図4aおよび4bに例示されている演算を実行するように実装することが望ましいと思われる。例えば、図4cは、一連の補間、再サンプリング、デシメーション、およびその他の演算を使用してハイパスフィルタリングおよびダウンサンプリングの演算と同等の機能を実行するフィルタバンクA112の実装A114のブロック図を示している。このような実装は、設計しやすく、および/または論理および/またはコードの機能ブロックを再利用できる可能性がある。例えば、図4cに示されているように、14kHzへのデシメーションおよび7kHzへのデシメーションの演算を実行するために同じ機能ブロックを使用することができる。スペクトル逆演算は、関数ejnπまたは+1と−1の値を交互にとる数列(−1)を信号に掛けることにより実装することができる。スペクトル整形演算は、信号を整形して所望の全体的なフィルタ応答を得られるように構成されたローパスフィルタとして実装することができる。
スペクトル逆演算の結果として、高帯域信号S30のスペクトルが反転されることに留意されたい。符号器および対応する復号器におけるその後の演算は、それに応じて構成することができる。例えば、本明細書で説明されているような高帯域励振発生器A300は、スペクトル反転形態を有する高帯域励振信号S120を発生するように構成することができる。
図4dは、一連の補間、再サンプリング、およびその他の演算を使用してアップサンプリングおよびハイパスフィルタリングの演算と同等の機能を実行するフィルタバンクB122の実装B124のブロック図を示している。フィルタバンクB124は、例えば、フィルタバンクA114などの符号器のフィルタバンクにおいて実行されるのと同様の演算を逆にする高帯域におけるスペクトル逆演算を含む。この特定の例では、フィルタバンクB124は、さらに、7100Hzの信号の成分を減衰する低帯域および高帯域のノッチフィルタも含むが、ただし、このようなフィルタはオプションであり、含める必要はない。本明細書とともに出願された「SYSTEMS,METHODS,AND APPARATUS FOR SPEECH SIGNAL FILTERING」という表題の特許出願(整理番号050551)は、フィルタバンクA110およびB120の特定の実装の要素のレスポンスに関係する追加の説明および図を含み、この文献は、参照により本明細書に組み込まれる。
狭帯域符号器A120は、(A)フィルタを記述する一組のパラメータおよび(B)入力音声信号の合成複製を形成するために記述されているフィルタを駆動する励振信号として入力音声信号を符号化するソースフィルタモデルに従って実装される。図5aは、音声信号のスペクトルエンベロープの一例を示している。このスペクトルエンベロープを特徴付けるピークは、声道の共鳴を表し、ホルマントと呼ばれる。ほとんどの音声コーダは、少なくともこの粗スペクトル構造をフィルタ係数などの一組のパラメータとして符号化する。
図5bは、狭帯域信号S20のスペクトルエンベロープの符号化に適用されるような基本的なソースフィルタ構成の一例を示している。分析モジュールでは、一定期間(典型的には、20ミリ秒)にわたる音声に応じてフィルタを特徴付ける一組のパラメータを計算する。これらのフィルタパラメータに応じて構成されたホワイトニングフィルタ(分析または予測誤差フィルタとも呼ばれる)は、スペクトルエンベロープを除去し、信号をスペクトル的に平坦化した結果得られるホワイトニング信号(残留信号とも呼ばれる)は、エネルギーが少なく、したがって変動も小さいため、元の音声信号に比べて符号化しやすい。残留信号の符号化から生じる誤差もまた、そのスペクトルにわたって均等に分散させることができる。フィルタパラメータおよび残留信号は、典型的には、そのチャネル上で効率よく伝送できるよう量子化される。復号器では、フィルタパラメータに従って構成された合成フィルタは、残留信号に基づく信号により励振され元の音声の合成音を生成する。合成フィルタは、典型的には、ホワイトニングフィルタの伝達関数の逆である伝達関数を持つように構成される。
図6は、狭帯域符号器A120の基本実装A122のブロック図を示している。この例では、線形予測符号化(LPC)分析モジュール210は、狭帯域信号S20のスペクトルエンベロープを一組の線形予測(LP)係数(例えば、全極型フィルタ1/A(z)の係数)として符号化する。分析モジュールは、典型的には、入力信号を一連の重なり合わないフレームとして処理し、新しい一組の係数がフレーム毎に計算される。フレーム期間は、一般に、信号が局所的に静止していると予測できる期間であり、よくある例は、20ミリ秒である(8kHzのサンプリングレートで160個のサンプルに相当する)。一例では、LPC分析モジュール210は、それぞれの20ミリ秒フレームのホルマント構造を特徴付ける10個のLPフィルタ係数からなる一組のフィルタ係数を計算するように構成される。また、入力信号を一連の重なり合うフレームとして処理するように分析モジュールを実装することも可能である。
それぞれのフレームのサンプルを直接的に分析するように分析モジュールを構成することができるか、またはサンプルを窓関数(例えば、ハミング窓)に従って最初に重み付けすることができる。分析は、さらに、30ミリ秒窓などの、フレームよりも大きい窓上で実行することもできる。この窓は、対称的(例えば、20ミリ秒フレームの直前および直後に5ミリ秒が含まれるように5−20−5)であっても、非対称的(例えば、先行するフレームの最後の10ミリ秒が含まれるように、10−20)であってもよい。LPC分析モジュールは、典型的には、Levinson−Durbin再帰法またはLeroux−Gueguenアルゴリズムを使用して、LPフィルタ係数を計算するように構成される。他の実装では、分析モジュールは、一組のLPフィルタ係数の代わりに、それぞれのフレームについて一組のケプストラム係数を計算するように構成することができる。
符号器A120の出力レートは、フィルタパラメータを量子化することにより、再現性に比較的ほとんど影響を及ぼすことなく、大きく低減されうる。線形予測フィルタ係数は、効率よく量子化することが困難であり、通常は、量子化および/またはエントロピー符号化のため、線スペクトル対(LSP)または線スペクトル周波数(LSF)などの他の表現にマッピングされる。図6の例では、LP係数−LSF変換220は、一組のLPフィルタ係数を対応する一組のLSFに変換する。LPフィルタ係数の他の1対1表現としては、PARCOR係数、対数面積比値、イミッタンススペクトル対(ISP)、およびGSM(Global System for Mobile Communications)AMR−WB(Adaptive Multirate−Wideband)コーデックで使用される、イミッタンススペクトル周波数(ISF)がある。典型的には、一組のLPフィルタ係数と対応する一組のLSFとの間の変換は、可逆であるが、実施形態は、さらに、変換が可逆でなく誤差を有しない符号器A120の実装も含みうる。
量子化器230は、一組の狭帯域LSF(または他の係数表現)を量子化するように構成され、狭帯域符号器A122は、狭帯域フィルタパラメータS40としてこの量子化の結果を出力するように構成される。このような量子化器は、典型的には、入力ベクトルをテーブルまたは符号帳内の対応するベクトルエントリへのインデックスとして符号化するベクトル量子化器を含む。
図6からわかるように、狭帯域符号器A122は、さらに、狭帯域信号S20を一組のフィルタ係数に従って構成されるホワイトニングフィルタ260(分析または予測誤差フィルタとも呼ばれる)に通すことにより残留信号を発生する。この特定の例では、ホワイトニングフィルタ260は、FIRフィルタとして実装されるが、IIR実装も使用することができる。この残留信号は、典型的には、狭帯域フィルタパラメータS40で表されない、ピッチに関係する長周期構造などの、音声フレームの知覚的に重要な情報を含む。量子化器270は、狭帯域励振信号S50として出力するためこの残留信号の量子化された表現を計算するように構成される。このような量子化器は、典型的には、入力ベクトルをテーブルまたは符号帳内の対応するベクトルエントリへのインデックスとして符号化するベクトル量子化器を含む。それとは別に、このような量子化器は、疎符号帳法のように、ベクトルを記憶装置から取り出すのではなく、復号器において動的に生成するために使用される1つまたは複数のパラメータを送信するように構成することができる。このような方法は、代数的CELP(符号帳励振線形予測)などの符号化方式および3GPP2(Third Generation Partnership 2)EVRC(Enhanced Variable Rate Codec)などのコーデックで使用される。
狭帯域符号器A120は、対応する狭帯域復号器から利用可能な同じフィルタパラメータに応じて符号化された狭帯域励振信号を生成することが望ましい。この方法で、結果として得られる符号化された狭帯域励振信号は、すでに、量子化誤差などのパラメータ値の非理想性をある程度考慮したものとなっていてもよい。したがって、復号器で使用可能な同じ係数値を使用してホワイトニングフィルタを構成することが望ましい。図6に示されているような符号器A122の基本的な例において、逆量子化器240は、狭帯域符号化パラメータS40を逆量子化し、LSF−LPフィルタ係数変換250は、結果として得られる値を対応する一組のLPフィルタ係数に逆マッピングし、この一組の係数は、量子化器270により量子化された残留信号を発生するようにホワイトニングフィルタ260を構成するために使用される。
狭帯域符号器A120のいくつかの実装は、残留信号に一番よく一致する一組の符号帳ベクトルのうちから1つを識別することにより符号化された狭帯域励振信号S50を計算するように構成される。ただし、狭帯域符号器A120は、残留信号を実際に発生することなく、残留信号の量子化された表現を計算するように実装することもできることに留意されたい。例えば、狭帯域符号器A120は、多数の符号帳ベクトルを使用して、対応する合成信号を(例えば、現在の一組のフィルタパラメータに従って)生成し、知覚的に重み付けされた領域内の元の狭帯域信号S20と一番よく一致する生成信号と関連する符号帳ベクトルを選択するように構成することができる。
図7は、狭帯域符号器B110の一実装B112のブロック図を示す。逆量子化器310は、狭帯域フィルタパラメータS40を逆量子化し(この場合、一組のLSFに)、LSF−LPフィルタ係数変換320は、(例えば、狭帯域符号器A122の逆量子化240および変換250に関して上で説明されているように)LSFを一組のフィルタ係数に変換する。逆量子化器340は、狭帯域残留信号S50を逆量子化し、狭帯域励振信号S80を生成する。狭帯域合成フィルタ330は、フィルタ係数および狭帯域励振信号S80に基づいて、狭帯域信号S90を合成する。つまり、狭帯域合成フィルタ330は、逆量子化されたフィルタ係数に従って狭帯域励振信号S80をスペクトル整形し、狭帯域信号S90を生成するように構成される。狭帯域復号器B112は、さらに、狭帯域励振信号S80を高帯域符号器A200に供給し、本明細書で説明されているように、これを使用して、高帯域励振信号S120を導き出す。以下で説明されているようないくつかの実装では、狭帯域復号器B110は、スペクトル傾斜、ピッチ利得、ピッチ遅延、および音声モードなどの狭帯域信号に関係する追加の情報を高帯域復号器B200に供給するように構成することができる。
狭帯域符号器A122および狭帯域復号器B112のシステムは、合成による分析の音声コーデックの基本例である。符号帳励振線形予測(CELP)符号化は、合成による分析のよく使われる一群であり、このようなコーダの実装では、固定または適応符号帳からエントリを選択すること、最小化演算、および/または知覚的重み付け演算などの演算を含む、残留信号の波形符号化を実行することができる。合成による分析の符号化の他の実装としては、混合励振線形予測(MELP)、代数的CELP(ACELP)、緩和CELP(RCELP)、正則パルス励振(RPE)、マルチパルスCELP(MPE)、およびベクトル和励振線形予測(VSELP)符号化がある。関係する符号化方法としては、マルチバンド励振(MBE)およびプロトタイプ波形補間(PWI)符号化がある。標準化された合成による分析の音声コーデックの例としては、残留励振線形予測(RELP)を使用するETSI(欧州電気通信標準化機構)−GSMフルレートコーデック(GSM 06.10)、GSMエンハンストフルレートコーデック(ETSI−GSM 06.60)、ITU(国際電気通信連合)標準11.8kb/s G.729 Annex Eコーダ、IS−136用IS(暫定基準)−641コーデック(時分割多元接続方式)、GSM適応マルチレート(GSM−AMR)コーデック、および4GV(商標)(Fourth−Generation Vocoder(商標))コーデック(QUALCOMM Incorporated、カリフォルニア州サンディエゴ)がある。狭帯域符号器A120および対応する復号器B110は、これらの記述のいずれか、または(A)フィルタを記述する一組のパラメータおよび(B)記述されているフィルタを駆動して音声信号を再現するために使用される励振信号として音声信号表す他の音声符号化技術(知られているか、または開発予定のもの)により実装することができる。
ホワイトニングフィルタが狭帯域信号S20から粗スペクトルエンベロープを除去した後でも、かなりの量の細かい高調波構造が、特に有声音声の場合に残る可能性がある。図8aは、母音などの音声信号に対する、ホワイトニングフィルタにより発生されうるような、残留信号の一例のスペクトルグラフを示している。この例で示されている周期構造は、ピッチに関係しており、同じ話者により発話される声音は、異なるホルマント構造だが、類似のピッチ構造を持つことができる。図8bは、ピッチパルスの時系列を示すような残留信号の一例の時間領域グラフを示す。
符号化効率および/または通話品質は、1つまたは複数のパラメータ値を使用してピッチ構造の特性を符号化することにより高められる。ピッチ構造の重要な特性の1つに、第1高調波の周波数(基本周波数とも呼ばれる)があり、これは、典型的には、60から400Hzまでの範囲内にある。この特性は、典型的には、ピッチ遅延とも呼ばれる、基本周波数の逆数として符号化される。ピッチ遅延は、1つのピッチ周期内のサンプルの数を示し、1つまたは複数の符号帳インデックスとして符号化することができる。男性話者が発する音声信号は、女性話者が発する音声信号に比べてピッチ遅延が大きくなる傾向を有する。
ピッチ構造に関係する他の信号特性は、周期性であり、これは、高調波構造の強度、あるいは言い換えると、信号が高調波または非高調波である程度を示す。周期性の2つの典型的な指標は、ゼロ交差および正規化自己相関関数(NACF)である。周期性は、さらに、ピッチ利得によっても示され、これは、一般に、符号帳利得として符号化される(例えば、量子化適応符号帳利得)。
狭帯域符号器A120は、狭帯域信号S20の長期高調波構造を符号化するように構成された1つまたは複数のモジュールを備えることができる。図9に示されているように、使用可能な1つの典型的なCELPパラダイムとして、短期特性または粗スペクトルエンベロープを符号化する開ループLPC分析モジュールと、その後に続く、精細ピッチまたは高調波構造を符号化する閉ループ長期予測分析段階がある。短期特性は、フィルタ係数として符号化され、長期特性は、ピッチ遅延およびピッチ利得などのパラメータに対する値として符号化される。例えば、狭帯域符号器A120は、1つまたは複数の符号帳インデックス(例えば、固定符号帳インデックスおよび適応符号帳インデックス)および対応する利得値を含む形式で符号化された狭帯域励振信号S50を出力するように構成することができる。狭帯域残留信号のこの量子化された表現の計算(例えば、量子化器270による)は、そのようなインデックスを選択すること、およびそのような値を計算することを含むことができる。ピッチ構造の符号化は、さらに、ピッチプロトタイプ波形の補間を含み、その演算は、連続するピッチパルスの間の差を計算することを含むことができる。長期構造のモデル化は、典型的には雑音に似た、構造化されていない、無声音声に対応するフレームに対し無効にすることができる。
図9に示されているようなパラダイムによる狭帯域復号器B110の実装は、長期構造(ピッチまたは高調波構造)が復元された後に狭帯域励振信号S80を高帯域復号器B200に出力するように構成することができる。例えば、このような復号器は、符号化された狭帯域励振信号S50の逆量子化された信号として狭帯域励振信号S80を出力するように構成することができる。もちろん、高帯域復号器B200が符号化された狭帯域励振信号S50の逆量子化を実行して狭帯域励振信号S80を取得するように狭帯域復号器B110を実装することも可能である。
図9に示されているようなパラダイムによる広帯域音声符号器A100の実装では、高帯域符号器A200は、短期分析またはホワイトニングフィルタにより生成されるような狭帯域励振信号を受け取るように構成することができる。つまり、狭帯域符号器A120は、長期構造を符号化する前に、狭帯域励振信号を高帯域符号器A200に出力するように構成することができる。しかし、高帯域符号器A200は、高帯域復号器B200により受け取られる同じ符号化情報を狭帯域チャネルから受け取ることが望ましく、したがって高帯域符号器A200により生成される符号化パラメータは、すでに、その情報に含まれる非理想性をある程度考慮していてもよい。そのため、高帯域符号器A200は、広帯域音声符号器A100により出力される同じパラメータ化された、および/または量子化された符号化狭帯域励振信号S50から狭帯域励振信号S80を再構成することが好ましい場合がある。このアプローチの潜在的利点の1つは、後述の高帯域利得係数S60bをより正確に計算できるという点である。
狭帯域符号器A120は、狭帯域信号S20の短期および/または長期構造を特徴付けるパラメータに加えて、狭帯域信号S20の他の特性に関係するパラメータ値を生成することができる。これらの値は、広帯域音声符号器A100から出力するように適宜量子化することができ、狭帯域フィルタパラメータS40間に含めるか、または別々に出力することができる。高帯域符号器A200は、さらに、これらの追加のパラメータのうちの1つまたは複数により高帯域符号化パラメータS60を計算するように構成することもできる(例えば、逆量子化の後)。広帯域音声復号器B100では、高帯域復号器B200は、狭帯域復号器B110を介してパラメータ値を受け取るように構成することができる(例えば、逆量子化の後)。それとは別に、高帯域復号器B200は、パラメータ値を直接的に受け取る(場合によってはさらに逆量子化する)ように構成することができる。
追加の狭帯域符号化パラメータの一例では、狭帯域符号器A120は、それぞれのフレームに対しスペクトル傾斜および音声モードパラメータの値を生成する。スペクトル傾斜は、通過帯域上のスペクトルエンベロープの形状に関係し、典型的には、量子化された一次反射係数により表される。大半の有声音声では、スペクトルエネルギーは、周波数が高くなると減少し、一次反射係数は、負となり、−1に近づきうる。ほとんどの無声音声は、一次反射係数がゼロに近くなるように平坦なスペクトルを有するか、または一次反射係数が正で、+1に近づくように高周波でより多くのエネルギーを有する。
音声モード(発声モードともいう)は、現在のフレームが有声または無声音声を表すかどうかを示す。このパラメータは、フレームに対する周期性の1つまたは複数の尺度(例えば、ゼロ交差、NACF、ピッチ利得)および/または音声活動、例えば、そのような尺度と閾値との間の関係などに基づく2進値をとることができる。他の実装では、音声モードパラメータは、無音または背景雑音などのモード、または無音と有声音声との間の遷移を示す1つまたは複数の他の状態を有する。
高帯域符号器A200は、ソース−フィルタモデルにより高帯域信号S30を符号化するように構成され、このフィルタの励振は、符号化された狭帯域励振信号に基づく。図10は、高帯域フィルタパラメータS60aおよび高帯域利得係数S60bを含む高帯域符号化パラメータS60のストリームを生成するように構成されている高帯域符号器A200の実装A202のブロック図を示す。高帯域励振発生器A300は、符号化された狭帯域励振信号S50から高帯域励振信号S120を導き出す。分析モジュールA210は、高帯域信号S30のスペクトルエンベロープを特徴付ける一組のパラメータ値を生成する。この特定の例では、分析モジュールA210は、LPC分析を実行して高帯域信号S30のそれぞれのフレームについて一組のLPフィルタ係数を生成するように構成される。線形予測フィルタ係数−LSF変換410は、一組のLPフィルタ係数を対応する一組のLSFに変換する。分析モジュール210および変換220に関して上で述べたように、分析モジュールA210および/または変換410は、他の係数群(例えば、ケプストラム係数)および/または係数表現(例えば、ISP)を使用するように構成することができる。
量子化器420は、一組の高帯域LSF(またはISPなどの他の係数表現)を量子化するように構成され、高帯域符号器A202は、高帯域フィルタパラメータS60aとしてこの量子化の結果を出力するように構成される。このような量子化器は、典型的には、入力ベクトルをテーブルまたは符号帳内の対応するベクトルエントリへのインデックスとして符号化するベクトル量子化器を含む。
高帯域符号器A202は、さらに、高帯域励振信号S120、および分析モジュールA210により生成される符号化されたスペクトルエンベロープ(例えば、一組のLPフィルタ係数)により合成高帯域信号S130を生成するように構成された合成フィルタA220も備える。合成フィルタA220は、典型的には、IIRフィルタとして実装されるが、FIR実装も、使用することができる、特定の一例では、合成フィルタA220は、6次線形自己回帰フィルタとして実装される。
高帯域利得係数計算器A230は、元の高帯域信号S30および合成高帯域信号S130のレベル間の1つまたは複数の差を計算して、フレームに対する利得エンベロープを指定する。量子化器430は、テーブルまたは符号帳内の対応するベクトルエントリへのインデックスとして入力ベクトルを符号化するベクトル量子化器として実装することができ、利得エンベロープを指定する1つまたは複数の値を量子化し、高帯域符号器A202は、この量子化の結果を高帯域利得係数S60bとして出力するように構成される。
図10に示されている一実装では、合成フィルタA220は、分析モジュールA210からフィルタ係数を受け取るように配置される。高帯域符号器A202の代替実装は、高帯域フィルタパラメータS60aからフィルタ係数を復号するように構成された逆量子化器および逆変換を含み、この場合、合成フィルタA220は、代わりに復号されたフィルタ係数を受け取るように配置される。このような代替構成では、高帯域利得計算器A230による利得エンベロープのさらに正確な計算をサポートすることができる。
特定の一例では、分析モジュールA210および高帯域利得計算器A230は、6個のLSFからなる一組のLSFおよび5つの利得値からなる一組の利得値をフレーム毎に出力し、これにより、狭帯域信号S20の高帯域拡張は、フレーム毎に11個の値を追加するだけ得られる。耳は、高い周波数では周波数誤差に対する感度が低くなる傾向があり、このため、低いLPC次数の高帯域符号化では、高いLPC次数で狭帯域符号化に匹敵する知覚的品質を有する信号を発生することができる。高帯域符号器A200の典型的な実装は、スペクトルエンベロープの高品質再構成のためフレーム毎に8から12ビットを出力し、時間エンベロープの高品質再構成のためフレーム毎にさらに8から12ビットを出力するように構成することができる。特定の他の例では、分析モジュールA210は、フレーム毎に8つのLSFからなる一組のLSFを出力する。
高帯域符号器A200のいくつかの実装は、高帯域周波数成分を有するランダム雑音信号を生成し、狭帯域信号S20、狭帯域励振信号S80、または高帯域信号S30の時間領域エンベロープに従って雑音信号を振幅変調することにより、高帯域励振信号S120を発生するように構成される。このような雑音に基づく方法では、無声音声については適切な結果を得ることができるが、残留信号が通常は高調波であり、したがってある種の周期的構造を有する有声音声では望ましくない場合がある。
高帯域励振発生器A300は、狭帯域励振信号S80のスペクトルを高帯域周波数範囲に拡張することにより高帯域励振信号S120を生成するように構成される。図11は、高帯域励振発生器A300の一実装A302のブロック図を示している。逆量子化器450は、符号化された狭帯域励振信号S50を逆量子化し、狭帯域励振信号S80を発生するように構成される。スペクトル拡張器A400は、狭帯域励振信号S80に基づいて高調波拡張信号S160を発生するように構成される。結合器470は、雑音発生器480により生成されたランダム雑音信号とエンベロープ計算器460により計算された時間領域エンベロープを組み合わせて、変調雑音信号S170を生成するように構成される。結合器490は、高調波拡張信号S160と変調雑音信号S170とを混合して、高帯域励振信号S120を生成するように構成される。
一例では、スペクトル拡張器A400は、狭帯域励振信号S80に対しスペクトル折り畳み演算(ミラーリングとも呼ばれる)を実行し、高調波拡張信号S160を生成するように構成される。スペクトル折り畳みは、励振信号S80のゼロ詰めを行い、次いで、ハイパスフィルタを適用してエイリアスを保持することにより実行することができる。他の例では、スペクトル拡張器A400は、狭帯域励振信号S80を高帯域にスペクトル平行移動することにより(例えば、アップサンプリングとその後の一定周波数コサイン信号との乗算を介して)、高調波拡張信号S160を生成するように構成される。
スペクトル折り畳みおよび平行移動の方法では、高調波構造が位相および/または周波数の点で狭帯域励振信号S80の元の高調波構造と不連続であるスペクトル拡張信号を生成することができる。例えば、このような方法では、再構成された音声信号内に音の小さいアーチファクトの原因となりうる、基本周波数の倍数の周波数に一般的には配置されないピークを有する信号を生成することができる。これらの方法は、さらに、不自然に強い音色特性を有する高周波高調波を発生する傾向も有する。さらに、PSTN信号は、8kHzでサンプリングすることができるが、3400Hz以下に帯域制限されるため、狭帯域励振信号S80の上側スペクトルは、エネルギーをほとんどまたは全く含まず、スペクトルを折り畳みまたはスペクトル平行移動演算に従って生成された拡張信号は、3400Hzよりも高いスペクトルホールを持つことができる。
高調波拡張信号S160を生成する他の方法は、狭帯域励振信号S80の1つまたは複数の基本周波数を識別することと、その情報に従って倍音を生成することを含む。例えば、励振信号の高調波構造は、振幅および位相情報と併せて基本周波数により特徴付けることができる。高帯域励振発信器A300の他の実装では、基本周波数および振幅に基づいて高調波拡張信号S160を発生する(例えば、ピッチ遅延およびピッチ利得により示されるように)。しかし、高調波拡張信号が、狭帯域励振信号S80と位相同期していない限り、結果として復号された音声の品質は、許容できない場合がある。
非線形関数は、狭帯域励振と位相同期している高帯域励振信号を生成するために使用することができ、位相不連続を生じることなく高調波構造を保持する。非線形関数は、さらに、高周波高調波の間の高い雑音レベルをもたらすこともでき、スペクトル折り畳みおよびスペクトル平行移動などの方法により生成される高周波倍音よりも自然に聞こえる傾向を有する。スペクトル拡張器A400のさまざまな実装により適用することが可能な典型的な記憶のない非線形関数は、絶対値関数(全波整流とも呼ばれる)、半波整流、平方、立方、およびクリッピングを含む。スペクトル拡張器A400の他の実装は、記憶を有する非線形関数を適用するように構成することができる。
図12は、非線形関数を適用して狭帯域励振信号S80のスペクトルを拡張するように構成されているスペクトル拡張器A400の一実装A402のブロック図である。アップサンプラ510は、狭帯域励振信号S80をアップサンプリングするように構成される。非線形関数の適用後、エイリアシングを最小にできるように信号を十分アップサンプリングすることが望ましいと思われる。特定の一例では、アップサンプラ510は、信号に対し8倍のアップサンプリングを実行する。アップサンプラ510は、入力信号のゼロ詰めを行い、結果をローパスフィルタ処理することによりアップサンプリング演算を実行するように構成することができる。非線形関数計算器520は、非線形関数をアップサンプリングされた信号に適用するように構成される。平方など、スペクトル拡張の他の非線形関数に勝る、絶対値関数の潜在的利点の1つは、エネルギー正規化が不要であるという点である。いくつかの実装では、絶対値関数は、それぞれのサンプルの符号ビットを剥ぎ取るか、またはクリアすることにより効率よく適用することができる。非線形関数計算器520は、さらに、アップサンプリングされた、またはスペクトル拡張された信号の振幅伸縮を実行するように構成することもできる。
ダウンサンプラ530は、非線形関数を適用したスペクトル拡張結果をダウンサンプリングするように構成される。ダウンサンプラ530は、帯域通過フィルタ処理演算を実行して、スペクトル拡張信号の所望の周波数帯域を選択してからサンプリングレートを下げることが望ましいと思われる(例えば、望ましくないイメージによるエイリアシングまたは破損を低減もしくは回避するため)。また、ダウンサンプラ530は、複数の段階でサンプリングレートを下げることが望ましい場合もある。
図12aは、スペクトル拡張演算の一例のさまざまな点での信号スペクトルを示す図であり、周波数スケールは、さまざまなグラフにおいて同一である。グラフ(a)は、狭帯域励振信号S80の一例のスペクトルを示している。グラフ(b)は、信号S80に対し8倍のアップサンプリングが実行された後のスペクトルを示している。グラフ(c)は、非線形関数を適用した後の拡張スペクトルの一例を示している。グラフ(d)は、ローパスフィルタ処理の後のスペクトルを示している。この例では、通過帯域は、高帯域信号S30の周波数上限(例えば、7kHzまたは8kHz)に拡張される。
グラフ(e)は、広帯域信号を得るためにサンプリングレートが1/4に下げられる、ダウンサンプリングの第1段階の後のスペクトルを示している。グラフ(f)は、拡張信号の高帯域部分を選択するハイパスフィルタ処理演算の後のスペクトルを示しており、グラフ(g)は、サンプリングレートが1/2に下げられる、ダウンサンプリングの第2段階の後のスペクトルを示している。特定の一例では、ダウンサンプラ530は、広帯域信号をフィルタバンクA112(または同じレスポンスを有する他の構造またはルーチン)のハイパスフィルタ130およびダウンサンプラ140に通して高帯域信号S30の周波数範囲およびサンプリングレートを有するスペクトル拡張信号を生成することによりハイパスフィルタ処理およびダウンサンプリングの第2段階を実行する。
グラフ(g)からわかるように、グラフ(f)に示されているハイパス信号のダウンサンプリングにより、そのスペクトルが反転する。この例では、ダウンサンプラ530は、さらに、信号に対しスペクトルフリッピング演算を実行するように構成される。グラフ(h)は、関数ejnπまたは+1と−1の値を交互にとる数列(−1)を信号に掛けることにより実行できるスペクトルフリッピング演算を適用した結果を示している。このような演算は、周波数領域で信号のデジタルスペクトルをπの距離だけシフトすることに相当する。同じ結果は、ダウンサンプリングおよびフリッピング演算を異なる順序で適用することによっても得られることに留意されたい。アップサンプリングおよび/またはダウンサンプリングの演算も、高帯域信号S30のサンプリングレート(例えば、7kHz)を有するスペクトル拡張信号を得るために再サンプリングを含むように構成することができる。
上記のように、フィルタバンクA110およびB120は、狭帯域および高帯域信号S20、S30の一方または両方がフィルタバンクA110の出力のところでスペクトル反転形式をとるように実装することができ、このスペクトル反転形式で符号化および復号が行われ、高帯域音声信号S110で出力される前にフィルタバンクB120のところで再びスペクトル反転される。もちろん、このような場合、図12aに示されているようなスペクトルフリッピング演算は、高帯域励振信号S120もスペクトル反転形式を有することが望ましいので、不要となるであろう。
スペクトル拡張器A402により実行されるようなスペクトル拡張演算のアップサンプリングおよびダウンサンプリングのさまざまなタスクは、数多くのいろいろな方法で構成され、配置されうる。例えば、図12bは、スペクトル拡張演算の他の例のさまざまな点での信号スペクトルを示す図であり、周波数スケールは、さまざまなグラフにおいて同一である。グラフ(a)は、狭帯域励振信号S80の一例のスペクトルを示している。グラフ(b)は、信号S80に対し2倍のアップサンプリングが実行された後のスペクトルを示している。グラフ(c)は、非線形関数を適用した後の拡張スペクトルの一例を示している。この場合、高い周波数で生じうるエイリアシングは、許容される。
グラフ(d)は、スペクトル反転演算の後のスペクトルを示している。グラフ(e)は、所望のスペクトル信号を得るためにサンプリングレートが1/2に下げられる、ダウンサンプリングの単一段階の後のスペクトルを示している。この例では、信号は、スペクトル反転形式になっており、そのような形式で高帯域信号S30を処理した高帯域符号器A200の実装で使用することができる。
非線形関数計算器520により生成されるスペクトル拡張信号は、周波数が高くなると顕著な減少を生じる可能性がある。スペクトル拡張器A402は、ダウンサンプリングされた信号に対しホワイトニング演算を実行するように構成されたスペクトルフラットナ540を備える。スペクトルフラットナ540は、固定ホワイトニング演算を実行するか、または適応ホワイトニング演算を実行するように構成することができる。適応ホワイトニングの特定の一例では、スペクトルフラットナ540は、ダウンサンプリングされた信号から、4つのフィルタ係数からなる一組のフィルタ係数を計算するように構成されたLPC分析モジュールおよびこれらの係数により信号のホワイトニングを行うように構成された4次分析フィルタを備える。スペクトル拡張器A400の他の実装は、スペクトルフラットナ540がダウンサンプラ530の前にスペクトル拡張信号に作用する構成を備える。
高帯域励振発生器A300は、高調波拡張信号S160を高帯域励振信号S120として出力するように実装することができる。しかし、場合によっては、高調波拡張信号のみを高帯域励振信号として使用すると、その結果、可聴アーチファクトが生じうる。音声の高調波構造は、一般に、低帯域に比べて高帯域においてあまり顕著でなく、高帯域励振信号で使用する高調波構造が高次すぎると、ブンブンという音が生じる可能性がある。このアーチファクトは、特に、女性話者の音声信号において顕著な場合がある。
実施形態は、高調波拡張信号S160と雑音信号とを混合するように構成されている高帯域励振発生器A300の実装を含む。図11に示されているように、高帯域励振発生器A302は、ランダム雑音信号を発生するように構成されている雑音発生器480を含む。一例では、雑音発生器480は、単位分散白色擬似ランダム雑音信号を発生するように構成されるが、他の実装では、雑音信号は、白色である必要はなく、周波数とともに変化する出力密度を有していてもよい。雑音発生器480は、雑音信号を確定関数として出力してその状態が復号器において複製されるように構成することが望ましいと思われる。例えば、雑音発生器480は、狭帯域フィルタパラメータS40および/または符号化された狭帯域励振信号S50など、同じフレーム内の前の方で符号化された情報の確定関数として雑音信号を出力するように構成することができる。
雑音発生器480により生成されたランダム雑音信号は、高調波拡張信号S160と混合される前に、狭帯域信号S20、高帯域信号S30、狭帯域励振信号S80、または高調波拡張信号S160の時間によるエネルギー分布を近似する時間領域エンベロープを持つように振幅変調することができる。図11に示されているように、高帯域励振発生器A302は、エンベロープ計算器460により計算された時間領域エンベロープに従って、雑音発生器480により生成された雑音信号を振幅変調するように構成された結合器470を備える。例えば、結合器470は、変調された雑音信号S170を生成するために、エンベロープ計算器460により計算された時間領域エンベロープに従って雑音発生器480の出力をスケーリングするように配置された乗算器として実装することができる。
高帯域励振発生器A302の一実装A304において、図13のブロック図に示されているように、エンベロープ計算器460は、高調波拡張信号S160のエンベロープを計算するように構成される。高帯域励振発生器A302の一実装A306において、図14のブロック図に示されているように、エンベロープ計算器460は、狭帯域励振信号S80のエンベロープを計算するように構成される。高帯域励振発生器A302の他の実装は、狭帯域ピッチパルスの時間に関する位置に応じて高調波拡張信号S160に雑音を加えるように他の何らからの方法で構成することができる。
エンベロープ計算器460は、エンベロープ計算を一連の部分タスクを含むタスクとして実行するように構成することができる。図15は、このようなタスクの一例T100の流れ図を示している。部分タスクT110は、平方値の列を生成するようにエンベロープがモデル化される信号(例えば、狭帯域励振信号S80または高調波拡張信号S160)のフレームのそれぞれのサンプルの平方を計算する。部分タスクT120は、平方値の列に対し平滑化演算を実行する。一例では、部分タスクT120は、
Figure 2008535027
に従って一次IIRローパスフィルタをこの値の列に適用する。
ただし、xはフィルタ入力であり、yはフィルタ出力であり、nは時間領域インデックスであり、aは0.5から1までの間の値を有する平滑化係数である。円滑化係数aの値は、固定であるか、または他の実装では、入力信号内の雑音の有無に応じて変えることもでき、aは雑音がなければ1に近く、雑音があれば0.5に近いようにすることができる。部分タスクT130は、平方根関数を平滑化された数列のそれぞれのサンプルに適用して、時間領域エンベロープを生成する。
エンベロープ計算器460のこのような一実装は、タスクT100のさまざまな部分タスクを直列方式で、および/または並列方式で実行するように構成することができる。タスクT100の他の実装では、部分タスクT110の前に、3〜4kHzなどのエンベロープがモデル化される信号の所望の周波数部分を選択するように構成された帯域通過演算を実行することができる。
結合器490は、高調波拡張信号S160と変調雑音信号S170とを混合して、高帯域励振信号S120を生成するように構成される。結合器490の実装は、例えば、高調波拡張信号S160と変調された雑音信号S170の和として高帯域励振信号S120を計算するように構成することができる。結合器490のこのような一実装は、総和を求める前に重み付け係数を高調波拡張信号S160および/または変調された雑音信号S170に適用することにより高調波励振信号S120を加重和として計算するように構成することができる。それぞれのそのような重み付け係数は、1つまたは複数の基準に従って計算することができ、固定であるか、またはそれとは別に、フレーム毎に計算されるか、またはサブフレーム毎に計算される適応値とすることができる。
図16は、高調波拡張信号S160と変調された雑音信号S170の加重和として高帯域励振信号S120を計算するように構成された結合器490の実装の一実装492のブロック図を示す。結合器492は、高調波重み付け係数S180に従って高調波拡張信号S160に重みを付け、雑音重み付け係数S190に従って変調された雑音信号S170に重みを付け、高帯域励振信号S120を重み付けされた信号の総和として出力するように構成される。この例では、結合器492は、高調波重み付け係数S180および雑音重み付け係数S190を計算するように構成された重み付け係数計算器550を含む。
重み付け係数計算器550は、高帯域励振信号S120内の高調波成分と雑音成分との所望の比に応じて重み付け係数S180およびS190を計算するように構成することができる。例えば、結合器492は、高帯域信号S30の比と似た高調波エネルギーと雑音エネルギーとの比を持つ高帯域励振信号S120を生成することが望ましいと思われる。重み付け係数計算器550のいくつかの実装では、重み付け係数S180、S190は、ピッチ利得および/または音声モードなど、狭帯域信号S20または狭帯域残留信号の周期性に関係する1つまたは複数のパラメータに従って計算される。重み付け係数計算器550のこのような一実装は、例えばピッチ利得に比例する値を高調波重み付け係数S180に割り当て、および/または無声音声信号については、有声音声信号よりも高い値を雑音の重み付け係数S190に割り当てるように構成することができる。
他の実装では、重み付け係数計算器550は、高帯域信号S30の周期性の尺度に従って高調波重み付け係数S180および/または雑音重み付け係数S190の値を計算するように構成される。このような一例では、重み付け係数計算器550は、高調波重み付け係数S180を、現在のフレームまたはサブフレームに対する高帯域信号S30の自己相関係数の最大値として計算し、この自己相関は、ピッチ遅延1つ分の遅延を含み、ゼロサンプルの遅延を含まない探索範囲にわたって実行される。図17は、ピッチ遅延1つ分の遅延を中心とし、ピッチ遅延1つ分以下の幅を有する長さnのサンプルのそのような探索範囲の例を示している。
図17は、重み付け係数計算器550が、複数の段階で高帯域信号S30の周期性の尺度を計算する他のアプローチの一例も示している。第1の段階では、現在のフレームは、多数のサブフレームに分割され、自己相関係数が最大である遅延は、サブフレーム毎に別々に識別される。上述のように、自己相関は、ピッチ遅延1つ分の遅延を含み、ゼロサンプルの遅延を含まない探索範囲にわたって実行される。
第2の段階では、遅延されたフレームは、対応する識別された遅延をそれぞれのサブフレームに適用し、その結果得られたサブフレームを連結して、最適な形で遅延されたフレームを形成し、高調波重み付け係数S180を元のフレームと最適な形で遅延されたフレームとの間の相関係数として計算することにより形成される。さらなる代替形態では、重み付け係数計算器550は、高調波重み付け係数S180をそれぞれのサブフレームについて第1の段階で得られた最大自己相関係数の平均として計算する。重み付け係数計算器550の実装は、さらに、相関係数をスケーリングし、および/またはそれを他の値と組合せ、高調波重み付け係数S180に対する値を計算するように構成することもできる。
重み付け係数計算器550は、フレーム内に周期性が存在することが他の何らかの方法により示される場合にのみ高帯域信号S30の周期性の尺度を計算するのが望ましいと思われる。例えば、重み付け係数計算器550は、ピッチ利得などの現在のフレームの周期性を示す他の指標と閾値との関係に従って高帯域信号S30の周期性の尺度を計算するように構成することができる。一例では、重み付け係数計算器550は、フレームのピッチ利得(例えば、狭帯域残留信号の適応符号帳利得)が0.5を超える値(それとは別に、少なくとも0.5)を持つ場合にのみ高帯域信号S30に対し自己相関演算を実行するように構成される。他の例では、重み付け係数計算器550は、音声モードの特定の状態を有するフレームについてのみ(例えば、有声信号のみ)高帯域信号S30に自己相関演算を実行するように構成される。このような場合、重み付け係数計算器550は、音声モードの他の状態および/またはピッチ利得のより小さい値を有するフレームに対し既定の重み付け係数を割り当てるように構成することができる。
実施形態は、周期性以外の特性、または周期性に加えて他の特性に従って重み付け係数を計算するように構成された重み付け係数計算器550の他の実装を含む。例えば、このような一実装は、小さなピッチ遅延を有する音声信号に比べて、大きなピッチ遅延を有する音声信号については高い値を雑音利得係数S190に割り当てるように構成することができる。重み付け係数計算器550の他のそのような実装は、他の周波数成分における信号のエネルギーに関する基本周波数の倍数周波数の信号のエネルギーの尺度に応じて、広帯域音声信号S10、または高帯域信号S30の高調波性の尺度を決定するように構成される。
高帯域音声符号器A100のいくつかの実装は、ピッチ利得および/または本明細書で説明されているような周期性または高調波性の他の尺度に基づいて周期性または高調波性の指標(例えば、フレームが高調波であるか非高調波であるかを示す1ビットフラグ)を出力するように構成される。一例では、対応する広帯域音声復号器B100は、この指標を使用して、重み付け係数計算などの演算を構成する。他の例では、このような指標は、音声モードパラメータに対する値を計算する際に符号器および/または復号器のところで使用される。
高帯域励振発生器A302は、励振信号のエネルギーが重み付け係数S180およびS190の特定の値の影響を実質的に受けないように高帯域励振信号S120を生成することが望ましいと思われる。そのような場合、重み付け係数計算器550は、高調波重み付け係数S180または雑音重み付け係数S190に対する値を計算し(または、記憶装置もしくは高帯域符号器A200の他の要素からそのような値を受け取り)、
Figure 2008535027
などの式に従って他の重み付け係数に対する値を求めるように構成することができる。
ただし、Wharmonicは、高調波重み付け係数S180を示し、Wnoiseは、雑音重み付け係数S190を示す。それとは別に、重み付け係数計算器550は、現在のフレームまたはサブフレームに対する周期性尺度の値に従って、事前に計算され式(2)などの一定エネルギー比を満たす、重み付け係数S180、S190の複数の対のうちの対応する対を選択するように構成することができる。式(2)が観察される重み付け係数計算器550の一実装では、高調波重み付け係数S180に対する典型的な値は、約0.7から約1.0までの範囲であり、雑音重み付け係数S190に対する典型的な値は、約0.1から約0.7までの範囲である。重み付け係数計算器550の他の実装は、高調波拡張信号S160と変調された雑音信号S170との間の所望の基準重み付けに従って式(2)を修正して得られる式にしたがって動作するように構成することができる。
アーチファクトは、残留信号の量子化された表現を計算するために疎符号帳(エントリがほとんどゼロ値である符号帳)が使用されている場合に合成音声信号中に発生しうる。符号帳が疎になるのは、特に、狭帯域信号が低いビットレートで符号化される場合である。符号帳が疎であることにより引き起こされるアーチファクトは、典型的には、時間に関して準周期的であり、ほとんどは3kHzよりも上で生じる。人の耳の時間分解能は高い周波数ほどよいので、これらのアーチファクトは、高帯域において顕著になる可能性がある。
実施形態は、反疎性フィルタ処理を実行するように構成されている高帯域励振発生器A300の実装を含む。図18は、逆量子化器450により生成された逆量子化狭帯域励振信号をフィルタ処理するように配置された反疎性フィルタ600を備える高帯域励振発生器A302の一実装A312のブロック図を示す。図19は、スペクトル拡張器A400により生成されたスペクトル拡張信号をフィルタ処理するように配置された反疎性フィルタ600を備える高帯域励振発生器A302の一実装A314のブロック図を示す。図20は、結合器490の出力をフィルタ処理して高帯域励振信号S120を生成するように構成された反疎性フィルタ600を備える高帯域励振発生器A302の一実装A316のブロック図を示す。もちろん、実装A304およびA306のいずれかの機能と実装A312、A314、およびA316のいずれかの機能とを組み合わせた高帯域励振発生器A300の実装も考えられ、本明細書では明確に開示されている。反疎性フィルタ600は、さらに、スペクトル拡張器A400内に、例えば、スペクトル拡張器A402の要素510、520、530、および540の後に、配置することもできる。反疎性フィルタ600は、さらに、スペクトル折り畳み、スペクトル平行移動、または高調波拡張を実行するスペクトル拡張器A400の実装とともに使用することもできることに明記されている。
反疎性フィルタ600は、その入力信号の位相を変えるように構成することができる。例えば、反疎性フィルタ600は、高帯域励振信号S120の位相がランダム化されるか、または他の何らかの方法で時間に関して均等に分散されるように構成され、配置されるのが望ましいと思われる。また、反疎性フィルタ600の応答はスペクトルに関して平坦であり、フィルタ処理された信号のスペクトルの大きさは目立つほどには変化しないことが望ましいと思われる。一例では、反疎性フィルタ600は、式
Figure 2008535027
による伝達関数を有する全域通過フィルタとして実装される。
このようなフィルタの1つの効果は、ごくわずかのサンプルにおいてはもはや連結されないように入力信号のエネルギーを分散することであろう。
符号帳の疎性による生じるアーチファクトは、通常、残留信号に含まれるピッチ情報が少ない、雑音に似た信号では顕著であり、また背景雑音中の音声についてもそうである。疎であると、典型的には、励振が長期構造を有する場合に生じるアーチファクトは比較的少なく、実際には、位相修正により有声信号中に雑音が入り込む可能性がある。そのため、無声信号をフィルタ処理し、少なくとも一部の有声信号を変更なしで通すように反疎性フィルタ600を構成することが望ましいと思われる。無声信号は、低いピッチ利得(例えば、量子化狭帯域適応符号帳利得)および平坦であるか、または周波数が高くなるにつれ上方に傾斜するスペクトルエンベロープを示す、ゼロに近いか、または正であるスペクトル傾斜(例えば、量子化一次反射係数)により特徴付けられる。反疎性フィルタ600の典型的な実装は、無声音声(例えば、スペクトル傾斜の値により示されているような)をフィルタ処理し、ピッチ利得が閾値よりも低い(それとは別に、閾値以下の)場合に有声音声をフィルタ処理し、他の場合には変更することなく信号を通すように構成される。
反疎性フィルタ600の他の実装は、異なる最大位相修正角(例えば、最大180度まで)を有するように構成された2つまたはそれ以上のフィルタを含む。そのような場合、反疎性フィルタ600は、ピッチ利得(例えば、量子化適応符号帳またはLTP利得)の値に応じて、これらのコンポーネントフィルタのうちからフィルタを選択し、低いピッチ利得値を有するフレームほど、大きな最大位相修正角が使用されるように構成することができる。反疎性フィルタ600の実装は、さらに、ほぼこの周波数スペクトルの範囲で位相を修正するように構成された異なるコンポーネントフィルタを備えることもでき、低いピッチ利得値を有するフレームほど、入力信号の広い周波数範囲にわたって位相を修正するように構成されたフィルタが使用される。
符号化された音声信号を正確に再現するために、合成された広帯域音声信号S100の高帯域部分および狭帯域部分のレベルの比が、元の広帯域音声信号S10と似た比になるようにするのが望ましいと思われる。高帯域符号化パラメータS60aにより表されるようなスペクトルエンベロープに加えて、高帯域符号器A200は、時間または利得エンベロープを指定することにより高帯域信号S30を特徴付けるように構成することができる。図10に示されているように、高帯域符号器A202は、1つのフレームまたはそのフレームの一部にわたって2つの信号のエネルギー間の差または比など、高帯域信号S30と合成された高帯域信号S130との間の関係に従って1つまたは複数の利得係数を計算するように構成され、配置された高帯域利得係数計算器A230を備える。高帯域符号器A202の他の実装では、高帯域利得計算器A230も、同様に構成されるが、ただし代わりに、高帯域信号S30と狭帯域励振信号S80または高帯域励振信号S120との間のそのような時変関係に従って利得エンベロープを計算するように構成することができる。
狭帯域励振信号S80および高帯域信号S30の時間エンベロープは、類似している可能性が高い。したがって、高帯域信号S30と狭帯域励振信号S80(またはそこから誘導された、高帯域励振信号S120または合成された高帯域信号S130などの、信号)との間の関係に基づく利得エンベロープは、一般に、高帯域信号S30のみに基づく利得エンベロープを符号化するのよりも効率が高い。典型的な実装では、高帯域符号器A202は、それぞれのフレームについて5つの利得係数を指定する8から12個のビットからなる量子化されたインデックスを出力するように構成される。
高帯域利得係数計算器A230は、利得係数計算を、1つまたは複数の一連の部分タスクを含む1つのタスクとして実行するように構成することができる。図21は、高帯域信号S30および合成された高帯域信号S130の相対的エネルギーに従って対応するサブフレームの利得値を計算するようなタスクの一例T200の流れ図を示している。タスクT220aおよびT220bは、それぞれの信号の対応するサブフレームのエネルギーを計算する。例えば、タスクT220aおよびT220bは、エネルギーをそれぞれのサブフレームのサンプルの平方の総和として計算するように構成することができる。タスクT230は、サブフレームの利得係数をこれらのエネルギーの比の平方根として計算する。この例では、タスクT230は、利得係数をサブフレームに関する高帯域信号S30のエネルギーと合成された高帯域信号S130のエネルギーとの比の平方根として計算する。
高帯域利得係数計算器S230は、窓関数に従ってサブフレームエネルギーを計算するように構成することが望ましいと思われる。図22は、利得係数計算タスクT200のそのような一実装T210の流れ図を示す。タスクT215aは、窓関数を高帯域信号S30に適用し、タスクT215bは、同じ窓関数を合成された高帯域信号S130に適用する。タスクT220aおよびT220bの実装222aおよび222bは、それぞれの窓のエネルギーを計算し、タスクT230は、サブフレームに対する利得係数をエネルギーの比の平方根として計算する。
隣接するサブフレームと重なる窓関数を適用することが望ましいと思われる。例えば、重ね追加の形で適用できる利得係数を生成する窓関数は、サブフレーム間の不連続性を低減または回避するのに役立ちうる。一例では、高帯域利得係数計算器A230は、窓が2つの隣接するサブフレームのそれぞれと1ミリ秒だけ重なる、図23aに示されているような台形窓関数を適用するように構成される。図23bは、20ミリ秒フレームの5つのサブフレームのそれぞれへのこの窓関数の適用を示す。高帯域利得係数計算器A230の他の実装は、対称的でも、非対称的でもよい異なる重なり期間および/または異なる窓形状(例えば、矩形、ハミング)を有する窓関数を適用するように構成することができる。また、高帯域利得係数計算器A230の実装は、異なる窓関数を1つのフレーム内の異なるサブフレームに適用するように構成され、および/または1つのフレームが異なる長さのサブフレームを含むことが可能である。
限定することなく、以下の値は、特定の実装に対する例として示されている。他の持続時間も使用可能であるが、これらの場合については、20ミリ秒フレームが仮定される。7kHzでサンプリングされた高帯域信号については、それぞれのフレームは、140個のサンプルを有する。このようなフレームが等しい長さの5つのサブフレームに分割された場合、それぞれのサブフレームは、28個のサンプルを有し、図23aに示されているような窓は、幅がサンプル42個分に相当する。8kHzでサンプリングされた高帯域信号については、それぞれのフレームは、160個のサンプルを有する。このようなフレームが等しい長さの5つのサブフレームに分割された場合、それぞれのサブフレームは、32個のサンプルを有し、図23aに示されているような窓は、幅がサンプル48個分に相当する。他の実装では、任意の幅のサブフレームを使用することができ、高帯域利得計算器A230の実装を1つのフレームのそれぞれのサンプルについて異なる利得係数を生成するように構成することすら可能である。
図24は、高帯域復号器B200の一実装B202のブロック図を示す。高帯域復号器B202は、狭帯域励振信号S80に基づき高帯域励振信号S120を生成するように構成されている高帯域励振発生器B300を備える。特定のシステム設計の選択肢に応じて、高帯域励振発生器B300は、本明細書で説明されているような高帯域励振発生器A300の実装のどれかにより実装することができる。典型的には、特定の符号化システムの高帯域符号器の高帯域励振発生器と同じレスポンスを有する高帯域励振発生器B300を実装することが望ましい。しかし、狭帯域復号器B110は、典型的には、符号化された狭帯域励振信号S50の逆量子化を実行するので、ほとんどの場合、高帯域励振発生器B300は、狭帯域復号器B110から狭帯域励振信号S80を受け取るように実装することができ、符号化された狭帯域励振信号S50を逆量子化するように構成された逆量子化器を備える必要はない。また、狭帯域復号器B110は、フィルタ330などの狭帯域合成フィルタに入力される前に逆量子化された狭帯域励振信号をフィルタ処理するように配置された反疎性フィルタ600のインスタンスを含むように実装することが可能である。
逆量子化器560は、高帯域フィルタパラメータS60aを逆量子化し(この例では、一組のLSFに)、LSF−LPフィルタ係数変換570は、LSFを一組のフィルタ係数に変換するように構成される(例えば、狭帯域符号器A122の逆量子化240および変換250に関して上で説明されているように)。他の実装では、上で述べたように、異なる係数群(例えば、ケプストラム係数)および/または係数表現(例えば、ISP)が使用可能である。高帯域合成フィルタB200は、高帯域励振信号S120および一組のフィルタ係数に従って合成された高帯域信号を生成するように構成される。高帯域符号器が合成フィルタを備えるシステムでは(例えば、上述の符号器A202の例のような)、その合成フィルタと同じレスポンス(例えば、同じ伝達関数)を持つ高帯域合成フィルタB200を実装することが望ましいと思われる。
高帯域復号器B202は、さらに、高帯域利得係数S60bを逆量子化するように構成された逆量子化器580、および逆量子化された利得係数を合成された高帯域信号に適用して高帯域信号S100を生成するように構成され配置された利得制御要素590(例えば、乗算器または増幅器)も備える。フレームの利得エンベロープが、複数の利得係数により指定される場合には、利得制御要素590は、対応する高帯域符号器の利得計算器(例えば、高帯域利得計算器A230)により適用されるような同じまたは異なる窓関数とすることができる窓関数に場合によって、利得係数をそれぞれのサブフレームに適用するように構成された論理回路を備えることができる。高帯域復号器B202の他の実装では、利得制御要素590は、同様に構成されるが、ただし代わりに逆量子化された利得係数を狭帯域励振信号S80または高帯域励振信号S120に適用するように配置される。
上述のように、高帯域符号器および高帯域復号器内を同じ状態にすることが望ましいと思われる(例えば、符号化時に逆量子化された値を使用することにより)。そのため、このような実装による符号化システムでは、高帯域励振発生器A300およびB300内の対応する雑音発生器に同じ状態を保証するようにすることが望ましいと思われる。例えば、このような実装の高帯域励振発生器A300およびB300は、雑音発生器の状態が、同じフレーム内ですでに符号化されている情報の確定関数となるように構成することができる(例えば、狭帯域フィルタパラメータS40またはその一部および/または符号化された狭帯域励振信号S50またはその一部)。
本明細書で説明されている要素の量子化器の1つまたは複数(例えば、量子化器230、420、または430)は、分類されたベクトル量子化を実行するように構成することができる。例えば、このような量子化器は、狭帯域チャネルおよび/または高帯域チャネルの同じフレーム内ですでに符号化されている情報に基づき一組の符号帳のうちの1つを選択するように構成することができる。このような技術は、典型的には、追加の符号帳の格納と引き換えに符号化効率を高める。
例えば図8および9に関して上で説明されているように、相当の量の周期的構造が、狭帯域音声信号S20から粗スペクトルエンベロープが取り除かれた後、残留信号に残りうる。例えば、残留信号は、おおよそ周期的なパルスまたはスパイクの時系列を含むことができる。典型的にはピッチに関係するこのような構造は、特に、有声音声信号内に発生する可能性が高い。狭帯域残留信号の量子化された表現の計算には、例えば、1つまたは複数の符号帳により表されるような長期周期性のモデルによるこのピッチ構造の符号化が含まれうる。
実際の残留信号のピッチ構造は、周期性モデルと正確には一致しない場合がある。例えば、残留信号は、ピッチパルスの位置の規則性に関してわずかなジッタを含むことがあり、このため、1つのフレーム内の連続するピッチパルス間の距離は、正確には等しくなく、構造はあまり規則正しくない。これらの不規則性のせいで、符号化効率が低下する傾向がある。
狭帯域符号器A120のいくつかの実装は、量子化の前または量子化時に適応時間軸伸縮を残留信号に適用することにより、または他の何らかの方法で、適応時間軸伸縮を符号化された励振信号内に含めることにより、ピッチ構造の正則化を実行するように構成される。例えば、このような符号器は、結果として得られる励振信号が最適な形で長期周期性のモデルに適合するように時間軸伸縮の程度を(例えば、1つまたは複数の知覚的重み付けおよび/または誤差最小化基準に従って)選択するか、または他の何らかの方法で計算するように構成することができる。ピッチ構造の正則化は、緩和符号励振線形予測(RCELP)符号器と呼ばれるCELP符号器のサブセットにより実行される。
RCELP符号器は、典型的には、適応時間シフトとして時間軸伸縮を実行するように構成される。この時間シフトは、負の数ミリ秒から正の数ミリ秒までの範囲の遅延とすることができ、通常は、音声の途切れるのを避けるために滑らかに変化する。いくつかの実装では、このような符号器は、それぞれのフレームまたはサブフレームが対応する固定時間シフトにより伸縮される、区分法で正則化を適用するように構成される。他の実装では、符号器は、連続伸縮関数として正則化を適用するように構成され、これにより、フレームまたはサブフレームは、ピッチ輪郭(ピッチ軌道とも呼ばれる)に応じて伸縮される。いくつかの場合において(例えば、米国特許出願公開第2004/0098255号で説明されているような)、符号器は、符号化された励振信号計算するために使用される知覚的に重み付けされた入力信号にシフトを適用することにより符号化された励振信号内に時間軸伸縮を含めるように構成される。
符号器は、正則化され量子化された符号化励振信号を計算し、復号器は、符号化された励振信号を逆量子化し、復号された音声信号を合成するために使用される励振信号を得る。復号された出力信号は、これにより、正則化により符号化された励振信号に含まれていた同じ変化する遅延を示す。典型的には、正則化の量を指定する情報は、復号器には伝送されない。
正則化は、残留信号を符号化しやすくする傾向があり、これは、長期予測器からの符号化利得を改善し、一般的にはアーチファクトを発生することなく符号化効率全体を高める。有声のフレームにのみ正則化を実行することが望ましいと思われる。例えば、狭帯域符号器A124は、有声信号などの長期構造を有するフレームまたはサブフレームのみをシフトするように構成することができる。正則化をピッチパルスエネルギーを含むサブフレームのみに実行することが望ましい場合もある。RCELP符号化のさまざまな実装については、米国特許第5,704,003号(Kleijnら)、米国特許第6,879,955号(Rao)、および米国特許出願公開第2004/0098255号(Kovesiら)で説明されている。RCELPコーダの既存の実装は、Telecommunications Industry Association(TIA)IS−127において記述されているようなEnhanced Variable Rate Codec(EVRC)、およびThird Generation Partnership Project 2(3GPP2)Selectable Mode Vocoder(SMV)を含む。
残念なことに、正則化は、高帯域励振が符号化された狭帯域励振信号から導き出される広帯域音声コーダ(広帯域音声符号器A100および広帯域音声復号器B100を備えるシステムなど)に問題を引き起こす可能性がある。時間軸伸縮信号から導き出すため、高帯域励振信号は、一般に、元の高帯域音声信号のとは異なる時間プロファイルを有する。言い換えると、高帯域励振信号は、もはや、元の高帯域音声信号と同期しなくなるということである。
伸縮された高帯域励振信号と元の高帯域音声信号との間の時間の不整合は、いくつかの問題の原因となりうる。例えば、伸縮された高帯域励振信号は、もはや、元の高帯域音声信号から抽出されたフィルタパラメータに従って構成された合成フィルタに適した信号源の励振を行えない。その結果、合成された高帯域信号は、復号される広帯域音声信号の知覚される品質を低下させる可聴アーチファクトを含みうる。
時間の不整合は、また、利得エンベロープ符号化の不効率の原因となりうる。上述のように、狭帯域励振信号S80と高帯域信号S30の時間エンベロープ間に相関が存在する可能性がある。これらの2つの時間エンベロープの間の関係に従って高帯域信号の利得エンベロープを符号化することにより、利得エンベロープを直接符号化するのに比べて符号化効率の向上が見込める。しかし、符号化された狭帯域励振信号が正則化された場合、この相関は、弱められる。狭帯域励振信号S80と高帯域信号S30との間の時間の不整合は、高帯域利得係数S60bに変動が出現する原因となりえ、また符号化効率も低下しうる。
実施形態は、対応する符号化された狭帯域励振信号に含まれる時間軸伸縮に応じて高帯域音声信号の時間軸伸縮を実行する広帯域音声符号化の方法を含む。このような方法の潜在的利点としては、復号された広帯域音声信号の品質を改善すること、および/または高帯域利得エンベロープを符号化する効率を改善することが挙げられる。
図25は、広帯域音声符号器A100の一実装AD10のブロック図を示す。符号器AD10は、符号化された狭帯域励振信号S50の計算の際に正則化を実行するように構成されている狭帯域符号器A120の一実装A124を含む。例えば、狭帯域符号器A124は、上述のRCELP実装のうちの1つまたは複数に従って構成することができる。
狭帯域符号器A124は、さらに、時間軸伸縮が適用される程度を指定する正則化データ信号SD10を出力するように構成される。狭帯域符号器A124が固定時間ソフトをそれぞれのフレームまたはサブフレームに適用するように構成されるさまざまな場合において、正則化データ信号SD10は、それぞれの時間シフト量をサンプル数、ミリ秒、または他の何らかの時間増分に関して整数または非整数値として示す一連の値を含むことができる。狭帯域符号器A124がフレームの時間スケールまたは他のサンプル列を他の何らかの方法で修正する(例えば、一方の部分を圧縮し、他方の部分を伸展することにより)ように構成される場合については、正則化情報信号SD10は、一組の多数パラメータなどの修正の対応する記述を含むことができる。特定の一例では、狭帯域符号器A124は、1つのフレームを3つのサブフレームに分割し、それぞれのサブフレームについて固定時間シフトを計算するように構成されており、正則化データ信号SD10は、符号化された狭帯域信号の正則化されたフレーム毎に3つの時間シフト量を示す。
広帯域音声符号器AD10は、入力信号により示される遅延量に従って、高帯域音声信号S30の一部を進行させるか、または進行を遅らせて、時間軸伸縮高帯域音声信号S30aを生成するように構成された遅延線D120を含む。図25に示されている例では、遅延線D120は、正則化データ信号SD10により示される伸縮に従って高帯域音声信号S30の時間軸伸縮を行うように構成される。このような方法で、符号化された狭帯域励振信号S50に含まれていた同じ量の時間軸伸縮も、分析の前に広帯域音声信号S30の対応する部分に適用される。この例は遅延線D120を高帯域符号器A200と別の要素として示しているが、他の実装では、遅延線D120は、高帯域符号器の一部として配置される。
高帯域符号器A200の他の実装は、時間軸伸縮されない広帯域音声信号S30のスペクトル分析(例えば、LPC分析)を実行し、高帯域利得パラメータS60bの計算の前に高帯域音声信号S30の時間軸伸縮を実行するように構成することができる。このような符号器は、例えば、時間軸伸縮を実行するように構成された遅延線D120の一実装を含むことができる。しかし、このような場合、時間軸伸縮されない信号S30の分析結果に基づく高帯域フィルタパラメータS60aは、高帯域励振信号S120と時間に関して不整合であるスペクトルエンベロープを記述することができる。
遅延線D120は、所望の時間軸伸縮演算を高帯域音声信号S30に適用するのに適している論理回路要素および記憶装置要素の任意の組合せに従って構成することができる。例えば、遅延線D120は、所望の時間シフトに従ってバッファから高帯域音声信号S30を読み出すように構成することができる。図26aは、シフトレジスタSR1を含む遅延線D120のそのような一実装D122の略図を示している。シフトレジスタSR1は、高帯域音声信号S30のm個の一番最近のサンプルを受け取り、記憶するように構成された長さm程度のバッファである。値mは、少なくともサポートされる正の最大値(つまり「進行」)および負の最大値(つまり「進行遅延」)の時間シフトの総和に等しい。値mは、高帯域信号S30の1つのフレームまたはサブフレームの長さに等しいと都合がよいと思われる。
遅延線D122は、シフトレジスタSR1のオフセット位置OLから時間軸伸縮された高帯域信号S30aを出力するように構成される。オフセット位置OLの位置は、例えば、正則化データ信号SD10により示されるような現在の時間シフトに従って基準位置(ゼロ時間シフト)を中心として変化する。遅延線D122は、進行限界と進行遅延限界とが等しくなるように、またはそれとは別に、他の方向に比べて一方の方向に実行されるシフトが大きくなるように他方の限界よりも一方の限界が大きくなるように構成することができる。図26aは、負の時間シフトよりも大きな正の時間シフトをサポートする特定の例を示している。遅延線D122は、1つまたは複数のサンプルを一度に出力するように構成することができる(例えば、出力バス幅に応じて)。
数ミリ秒を超える大きさの正則化時間シフトだと、復号された信号内に可聴アーチファクトが入り込む可能性がある。典型的には、狭帯域符号器A124により実行されるような正則化時間シフトの大きさは、数ミリ秒以内であり、正則化データ信号SD10により示される時間シフトは、制限される。しかし、このような場合には、遅延線D122は正および/または負の方向の時間シフトに最大限界を課すように構成されることが望ましいと思われる(例えば、狭帯域符号器によって課される限界よりも厳しい限界に従うため)。
図26bは、シフト窓SWを含む遅延線D120の一実装D124の略図を示している。この例では、オフセット配置の位置OLは、シフト窓SWにより制限される。図26bは、バッファ長mがシフト窓SWの幅よりも大きい場合を示しているが、遅延線D124も、シフト窓SWの幅がmに等しくなるように実装することができる。
他の実装では、遅延線D120は、所望の時間シフトに従ってバッファに高帯域音声信号S30を書き込むように構成される。図27は、高帯域音声信号S30を受け取り、格納するように構成されている2つのシフトレジスタSR2およびSR3を備える遅延線D120のそのような一実装D130の略図を示している。遅延線D130は、例えば正則化データ信号SD10により示されるような時間シフトに従ってシフトレジスタSR2から1つのフレームまたはサブフレームをシフトレジスタSR3に書き込むように構成される。シフトレジスタSR3は、時間軸伸縮された高帯域信号S30を出力するように構成されたFIFOバッファとして構成される。
図27に示されている特定の例では、シフトレジスタSR2は、フレームバッファ部分FB1および遅延バッファ部分DBを含み、シフトレジスタSR3は、フレームバッファ部分FB2、進行バッファ部分AB、および進行遅延バッファ部分RBを含む。進行バッファABおよび進行遅延バッファRBの長さは、等しいか、または一方が他方よりも大きく、これにより、他の方向に比べて一方の方向のシフト量が大きい場合に対応できる。遅延バッファDBおよび進行遅延バッファ部分RBは、同じ長さを持つように構成できる。それとは別に、遅延バッファDBは、シフトレジスタSR3に格納する前にサンプルの伸縮などの他の処理演算を含むことができる、フレームバッファFB1からサンプルをシフトレジスタSR3に転送するために必要な時間間隔を考慮するため進行遅延バッファRBに比べて短くすることができる。
図27の例では、フレームバッファFB1は、高帯域信号S30の1つのフレームの長さと等しい長さを有するように構成される。他の例では、フレームバッファFB1は、高帯域信号S30の1つのサブフレームの長さと等しい長さを有するように構成される。このような場合、遅延線D130は、同じ(例えば、平均)遅延をシフトされるフレームのすべてのサブフレームに適用する論理を備えるように構成することができる。遅延線D130は、さらに、フレームバッファFB1からの値を平均する論理も備えることができ、値は進行遅延バッファRBまたは進行バッファAB内に上書きされる。他の例では、シフトレジスタSR3は、フレームバッファFB1のみを介して高帯域信号S30の値を受け取るように構成することができ、このような場合、遅延線D130は、シフトレジスタSR3に書き込まれた連続するフレームまたはサブフレーム間のギャップを補間する論理を備えることができる。他の実装では、遅延線D130は、シフトレジスタSR3に書き込む前にフレームバッファFB1からのサンプルに対し伸縮演算を実行するように構成することができる(例えば、正則化データ信号SD10により記述されている機能による)。
遅延線D120は、正則化データ信号SD10により指定された時間軸伸縮に、同一ではないとしても基づく時間軸伸縮を適用することが望ましいと思われる。図28は、遅延値マッパーD110を備える広帯域音声符号器AD10の一実装AD12のブロック図を示す。遅延値マッパーD110は、正則化データ信号SD10により示される時間軸伸縮をマッピング遅延値SD10aにマッピングするように構成される。遅延線D120は、マッピングされた遅延値SD10aにより示される時間軸伸縮により時間軸伸縮された高帯域音声信号S30aを生成するように構成される。
狭帯域符号器により適用される時間シフトは、時間の経過とともに滑らかに進行すると予測できる。したがって、典型的には、音声の1フレーム内のサブフレームに適用される平均狭帯域時間シフトを計算し、この平均に従って高帯域音声信号S30の対応するフレームをシフトするだけで十分である。このような一例では、遅延値マッパーD110は、それぞれのフレームに対するサブフレーム遅延値の平均を計算するように構成され、遅延線D120は、計算された平均を狭帯域信号S30の対応するフレームに適用するように構成される。他の例では、より短い期間での平均(2サブフレーム、または1フレームの半分)またはより長い期間(2フレームなど)を計算し、適用することができる。平均がサンプルの非整数値の場合、遅延値マッパーD110は、遅延線D120に出力する前に値をサンプルの整数個数に丸めるように構成されうる。
狭帯域符号器A124は、符号化された狭帯域励振信号に非整数個数のサンプルの正則化時間シフトを含めるように構成することができる。このような場合、遅延値マッパーD110は、狭帯域時間シフトをサンプルの整数に丸めるように構成されること、また遅延線D120は、丸められた時間シフトを高帯域音声振動S30に適用することが望ましいと思われる。
広帯域音声符号器AD10のいくつかの実装では、狭帯域音声信号S20および高帯域音声信号S30のサンプリングレートは異なっていてよい。そのような場合、遅延値マッパーD110は、正則化データ信号SD10で示される時間シフト量を調節し、狭帯域音声信号S20(または狭帯域励振信号S80)のサンプリングレートと高帯域音声信号S30のサンプリングレートとの差を考慮するように構成することができる。例えば、遅延値マッパーD110は、サンプリングレートの比に応じて時間シフト量をスケーリングするように構成することができる。上述のような特定の一例では、狭帯域音声信号S20は、8kHzでサンプリングされ、高帯域音声信号S30は、7kHzでサンプリングされる。この場合、遅延値マッパーD110は、それぞれのシフト量に7/8を掛けるように構成される。遅延値マッパーD110の実装は、さらに、本明細書で説明されているように整数丸めおよび/または時間シフト平均演算とあわせてこのようなスケーリング演算を実行するように構成することができる。
他の実装では、遅延線D120は、フレームまたは他のサンプル列の時間スケールを他の何らかの方法で修正するように構成される(例えば、一方の部分を圧縮し、他方の部分を伸長することにより)。例えば、狭帯域符号器A124は、ピッチ輪郭または軌道などの関数に従って正則化を実行するように構成することができる。このような場合、正則化データ信号SD10は、一組のパラメータなどの関数の対応する記述を含むことができ、遅延線D120は、この関数に従って高帯域音声信号S30のフレームまたはサブフレームを伸縮するように構成された論理回路を備えることができる。他の実装では、遅延値マッパーD110は、遅延線D120により高帯域音声信号S30に適用される前に、関数の平均、スケーリング、および/または丸めを行うように構成される。例えば、遅延値マッパーD110は、関数に従って、それぞれの遅延値がサンプルの個数を示す1つまたは複数の遅延値を計算するように構成することができ、次いで、遅延値は遅延線D120により適用され、高帯域音声信号S30の1つまたは複数の対応するフレームまたはサブフレームが時間軸伸縮される。
図29は、対応する符号化された狭帯域励振信号に含まれる時間軸伸縮による高帯域音声信号の時間軸伸縮の方法MD100の流れ図を示す。タスクTD100は、広帯域音声信号を処理して、狭帯域音声信号および高帯域音声信号を取り出す。例えば、タスクTD100は、フィルタバンクA110の一実装などの、ローパスおよびハイパスフィルタを含むフィルタバンクを使用して広帯域音声信号をフィルタ処理するように構成することができる。タスクTD200は、狭帯域音声信号を少なくとも1つの符号化された狭帯域励振信号および複数の狭帯域フィルタパラメータに符号化する。符号化された狭帯域励振信号および/またはフィルタパラメータは、量子化され、符号化された狭帯域音声信号は、さらに、音声モードパラメータなどの他のパラメータを含むこともできる。タスクTD200は、さらに、符号化された狭帯域励振信号における時間軸伸縮を含む。
タスクTD300は、狭帯域励振信号に基づいて高帯域励振信号を発生する。この場合、狭帯域励振信号は、符号化された狭帯域励振信号に基づく。タスクTD400は、少なくとも高帯域励振信号に従って、高帯域音声信号を少なくとも複数の高帯域フィルタパラメータに符号化する。例えば、タスクTD400は、高帯域音声信号を複数の量子化されたLSFに符号化するように構成することができる。タスクTD500は、時間シフトを、符号化された狭帯域励振信号に含まれる時間軸伸縮に関係する情報に基づく高帯域音声信号に適用する。
タスクTD400は、高帯域音声信号に対しスペクトル分析(LPC分析など)を実行し、および/または高帯域音声信号の利得エンベロープを計算するように構成することができる。このような場合、タスクTD500は、分析および/または利得エンベロープ計算に先立って時間シフトを高帯域音声信号に適用するように構成することができる。
広帯域音声符号器A100の他の実装は、符号化された狭帯域励振信号に含まれる時間軸伸縮により引き起こされる高帯域励振信号S120の時間軸伸縮を反転するように構成される。例えば、高帯域励振発生器A300は、正則化データ信号SD10またはマッピングされた遅延値SD10aを受け取るように構成されている遅延線D120の一実装を含み、対応する反転時間シフトを狭帯域励振信号S80、および/または高調波拡張信号S160または高帯域励振信号S120などその狭帯域励振信号に基づくその後の信号に適用するように実装することができる。
他の広帯域音声符号器実装は、狭帯域音声信号S20および高帯域音声信号S30を互いに独立に符号化するように構成することができ、これにより、高帯域音声信号S30は、高帯域スペクトルエンベロープおよび高帯域励振信号の表現として符号化される。このような実装は、符号化された狭帯域励振信号に含まれる時間軸伸縮に関係する情報に従って、高帯域残留信号の時間軸伸縮を実行するか、または他の何らかの方法で、符号化された高帯域励振信号に時間軸伸縮を含めるように構成することができる。例えば、高帯域符号器は、時間軸伸縮を高帯域残留信号に適用するように構成されている本明細書で説明されているような遅延線D120および/または遅延値マッパーD110の一実装を備えることができる。このような演算の潜在的利点として、高帯域残留信号の効率的な符号化、および構成された狭帯域音声信号と高帯域音声信号との良好な一致が挙げられる。
上述のように、本明細書で説明されているな実施形態は、狭帯域システムとの互換性をサポートし、トランスコーディングの利用を避けつつ、埋め込まれた符号化を実行するために使用することができる実装を含む。高帯域符号化のサポートは、さらに、下位互換性を維持しつつ広帯域をサポートするチップ、チップセット、デバイス、および/またはネットワーク、および狭帯域のみをサポートするチップ、チップセット、デバイス、および/またはネットワークをコスト基準に基づいて差別化するために利用することができる。本明細書で説明されているような高帯域符号化のサポートも、低帯域符号化をサポートする技術と併せて使用することができ、またこのような実施形態によるシステム、方法、または装置は、例えば、約50または100Hzから最大約7または8kHzまでの周波数成分の符号化をサポートすることができる。
上述のように、音声コーダに高帯域のサポートを追加することにより、特に摩擦音の区別に関して明瞭さが改善されうるこのような区別は、通常は、特定の背景状況から聴取者によりもたらされることがあるが、高帯域サポートは、自動化音声メニューナビゲーションおよび/または自動呼出処理のシステムなど、音声認識および他の機械解釈用途における有効機能として使用することができる。
一実施形態による装置は、携帯電話またはパーソナルデジタルアシスタント(PDA)などの無線通信用のポータブルデバイス内に組み込むことができる。それとは別に、そのような装置は、VoIPハンドセット、VoIP通信をサポートするように構成されたパーソナルコンピュータ、または電話もしくはVoIP通信の経路選択を行うように構成されたネットワークデバイスなどの他の通信デバイスに入れることもできる。例えば、一実施形態による装置は、通信デバイス用のチップまたはチップセット内に実装することができる。特定の用途に応じて、そのようなデバイスは、さらに、音声信号のアナログ−デジタルおよび/またはデジタル−アナログ変換、増幅および/または他の信号処理演算を実行するための回路、および/または符号化された音声信号の送信および/または受信のための高周波回路などの機能を備えることもできる。
実施形態は、本出願において利益を主張する米国仮特許出願第60/667,901号および60/673,965号で開示されている他の特徴のうちの1つまたは複数を含み、および/またはそれらとともに使用することができることが明らかに考えられ、開示されている。このような特徴は、高帯域で発生し、狭帯域には実質的に存在しない、短時間の高エネルギーバーストの除去を含む。このような特徴は、高帯域LSFなどの係数表現の固定または適応平滑化を含む。このような特徴は、LSFなどの係数表現の量子化に関連する雑音の固定または適応型整形を含む。このような特徴は、さらに、利得エンベロープの固定または適応平滑化、および利得エンベロープの適応減衰を含む。
説明されている実施形態を前記のように提示したのは、当業者が本発明を製作または使用することができるようにするためである。これらの実施形態に対するさまざまな修正形態も可能であり、本明細書で提示されている一般原理を他の実施形態にも適用することができる。例えば、一実施形態は、一部または全体として、ハード配線回路として、特定用途向け集積回路に組み込まれる回路構成として、または不揮発性記憶装置内にロードされるファームウェアプログラムまたは機械可読コードとしてデータ記憶媒体から、またはデータ記憶媒体にロードされるソフトウェアプログラムとして実装することができ、前記コードは、マイクロプロセッサまたは他のデジタル信号処理ユニットなどの論理素子のアレイにより実行可能な命令である。データ記憶媒体としては、半導体メモリ(限定することなく、ダイナミックまたはスタティックRAM(ランダムアクセスメモリ)、ROM(読み取り専用メモリ)、および/またはフラッシュRAMを含んでよい)、または強誘電体、磁気抵抗、オボニック、ポリマー、または相変化メモリなどの記憶素子のアレイ、または磁気もしくは光ディスクなどのディスク媒体が考えられる。「ソフトウェア」という用語は、ソースコード、アセンブリ言語コード、機械語コード、バイナリコード、ファームウェア、マクロコード、マイクロコード、論理素子のアレイにより実行可能な命令からなる1つまたは複数の命令セットまたは命令シーケンス、およびそのような例の任意の組合せを含むものと理解すべきである。
高帯域励振発生器A300およびB300、高帯域符号器A100、高帯域復号器B200、広帯域音声符号器A100、および広帯域音声復号器B100の実装のさまざまな要素は、例えば、同じチップ上またはチップセット内の2つまたはそれ以上のチップに常駐する電子および/または光デバイスとして実装することができるが、このような制限なしで他の配列も考えられる。このような装置の1つまたは複数の要素は、マイクロプロセッサ、組み込み型プロセッサ、IPコア、デジタルシグナルプロセッサ、FPGA(フィールドプログラマブルゲートアレイ)、ASSP(特定用途向け標準製品)、およびASIC(特定用途向け集積回路)などの論理素子(例えば、トランジスタ、ゲート)の1つまたは複数の固定もしくはプログラム可能なアレイ上で実行するように構成された1つまたは複数の命令セットとして全体または一部実装されうる。また、1つまたは複数のこのような要素は、構造を共通して持つことが可能である(例えば、異なる時刻に異なる要素に対応するコードの部分を実行するために使用されるプロセッサ、異なる時刻に異なる要素に対応するタスクを実行するために実行される命令セット、または異なる時刻に異なる要素に対する演算を実行する電子および/または光デバイスの配列)。さらに、そのような要素の1つまたは複数は、装置が組み込まれるデバイスまたはシステムの他の動作に関係するタスクなど、装置の動作に直接的には関係しないタスクを実行するか、または他の命令セットを実行するために使用することが可能である。
図30は、狭帯域部分と高帯域部分を有する音声信号の高帯域部分を符号化する、一実施形態による、方法M100の流れ図を示している。タスクX100は、高帯域部分のスペクトルエンベロープを特徴付ける一組のフィルタパラメータを計算する。タスクX200は、非線形関数を狭帯域部分から導き出された信号に適用することによりスペクトル拡張信号を計算する。タスクX300は、(A)一組のフィルタパラメータおよび(B)スペクトル拡張信号に基づく高帯域励振信号に従って合成された高帯域信号を生成する。タスクX400は、(C)高帯域部分のエネルギーと(D)狭帯域部分から導き出される信号のエネルギーとの間の関係に基づいて利得エンベロープを計算する。
図31aは、一実施形態による高帯域励振信号を発生する方法M200の流れ図を示している。タスクY100は、非線形関数を音声信号の狭帯域部分から導き出された狭帯域励振信号に適用することにより高調波拡張信号を計算する。タスクY200は、高調波拡張信号と変調された雑音信号とを混合して、高帯域励振信号を発生する。図31bは、タスクY300およびY400を含む他の実施形態による高帯域励振信号を発生する方法M210の流れ図を示している。タスクY300は、狭帯域励振信号と高調波拡張信号のうちの1つの時間とともに変わるエネルギーによる時間領域エンベロープを計算する。タスクY400は、時間領域エンベロープに従って雑音信号を変調し、変調された雑音信号を生成する。
図32は、狭帯域部分と高帯域部分を有する音声信号の高帯域部分を復号する、一実施形態による、方法M300の流れ図を示している。タスクZ100は、高帯域部分のスペクトルエンベロープを特徴付ける一組のフィルタパラメータおよび高帯域部分の時間エンベロープを特徴付ける一組の利得係数を受け取る。タスクZ200は、非線形関数を狭帯域部分から導き出された信号に適用することによりスペクトル拡張信号を計算する。タスクZ300は、(A)一組のフィルタパラメータおよび(B)スペクトル拡張信号に基づく高帯域励振信号に従って合成された高帯域信号を発生する。タスクZ400は、一組の利得係数に基づいて合成された高帯域信号の利得エンベロープを変調する。例えば、タスクZ400は、一組の利得係数を狭帯域部分から導き出された励振信号、スペクトル拡張信号、高帯域励振信号、または合成された高帯域信号に適用することにより、合成された高帯域信号の利得エンベロープを変調するように構成することができる。
実施形態は、さらに、例えば、音声符号化、符号化、および復号の追加の方法も含み、これらは、このような方法を実行するように構成された構造的な実施形態の説明により、本明細書で明確に開示されているとおりである。これらの方法はそれぞれ、さらに、論理素子(例えば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、または他の有限状態機械)のアレイを含む機械により可読および/または実行可能な1つまたは複数の命令セットとして目に見える形で具現化(例えば、上述のような1つまたは複数のデータ記憶媒体において)することもできる。そのため、本発明は、上に示されている実施形態に限定されることを意図されておらず、むしろ、元の開示の一部をなす、出願された付属の請求項に含む、本明細書において何らかの形態で開示されている原理および新規性のある特徴と一致する最も広い範囲を与えられるべきである。
一実施形態による広帯域音声符号器A100のブロック図である。 広帯域音声符号器A100の一実装A102のブロック図である。 一実施形態による広帯域音声復号器B100のブロック図である。 広帯域音声符号器B100の一実装B102のブロック図である。 フィルタバンクA110の一実装A112のブロック図である。 フィルタバンクB120の一実装B122のブロック図である。 フィルタバンクA110の一例の低帯域および高帯域からなる帯域幅の有効範囲を示す図である。 フィルタバンクA110の他の例の低帯域および高帯域からなる帯域幅の有効範囲を示す図である。 フィルタバンクA112の一実装A114のブロック図である。 フィルタバンクB122の一実装B124のブロック図である。 音声信号の対数振幅に対する周波数のグラフ例である。 基本線形予測符号化システムのブロック図である。 狭帯域符号器A120の一実装A122のブロック図である。 狭帯域符号器B110の一実装B112のブロック図である。 有声音声の残留信号の対数振幅に対する音声の周波数のグラフ例である。 有声音声の残留信号の対数振幅に対する音声の時間のグラフ例である。 長期予測も実行する基本線形予測符号化システムのブロック図である。 高帯域符号器A200の一実装A202のブロック図である。 高帯域励振発生器A300の一実装A302のブロック図である。 スペクトル拡張器A400の一実装A402のブロック図である。 スペクトル拡張演算の一例におけるさまざまな点での信号スペクトルのグラフである。 スペクトル拡張演算の他の例におけるさまざまな点での信号スペクトルのグラフである。 高帯域励振発生器A302の一実装A304のブロック図である。 高帯域励振発生器A302の一実装A306のブロック図である。 エンベロープ計算タスクT100の流れ図である。 結合器490の一実装492のブロック図である。 高帯域信号S30の周期性の尺度を計算するアプローチを示す図である。 高帯域励振発生器A302の一実装A312のブロック図である。 高帯域励振発生器A302の一実装A314のブロック図である。 高帯域励振発生器A302の一実装A316のブロック図である。 利得計算タスクT200の流れ図である。 利得計算タスクT200の一実装T210の流れ図である。 窓関数の図である。 図23aに示されているような窓関数の音声信号のサブフレームへの適用を示す図である。 高帯域復号器B200の一実装B202のブロック図である。 広帯域音声符号器A100の一実装AD10のブロック図である。 遅延線D120の一実装D122の略図である。 遅延線D120の一実装D124の略図である。 遅延線D120の一実装D130の略図である。 広帯域音声符号器AD10の一実装AD12のブロック図である。 一実施形態による信号処理MD100の方法の流れ図である。 一実施形態による方法M100の流れ図である。 一実施形態による方法M200の流れ図である。 方法M200の一実装M210の流れ図である。 一実施形態による方法M300の流れ図である。

Claims (42)

  1. 高帯域励振信号を生成する方法であって、
    低帯域励振信号に基づく信号のスペクトルを高調波拡張することと、
    前記低帯域励振信号に基づく信号の時間領域エンベロープを計算することと、
    前記時間領域エンベロープに従って雑音信号を変調することと、
    (A)前記高調波拡張の結果に基づく高調波拡張信号と、(B)前記変調の結果に基づく変調雑音信号とを結合することとを備え、
    前記高帯域励振信号は、前記結合の結果に基づく方法。
  2. 前記高調波拡張することは、前記低帯域励振信号に基づく信号に非線形関数を適用することを備える請求項1に記載の方法。
  3. 前記非線形関数を適用することは、前記時間領域において非線形関数を適用することを備える請求項2に記載の方法。
  4. 前記非線形関数は、メモリレス非線形関数である請求項2に記載の方法。
  5. 前記非線形関数は時間不変である請求項2に記載の方法。
  6. 前記非線形関数は、絶対値関数、平方関数、及びクリッピング関数のうちの少なくとも1つを備える請求項2に記載の方法。
  7. 前記非線形関数は、絶対値関数である請求項2に記載の方法。
  8. 前記低帯域励振信号に基づく信号の時間領域エンベロープを計算することは、前記低帯域励振信号、前記低帯域励振信号に基づく低帯域音声信号、及び、前記高調波拡張信号のうちの1つの時間領域エンベロープを計算することを含む請求項1に記載の方法。
  9. 前記高調波拡張することは、前記低帯域励振信号に基づくアップサンプルされた信号のスペクトルを高調波拡張することを含む請求項1に記載の方法。
  10. (A)前記結合する前に、前記高調波拡張信号をスペクトル的に平坦化することと、(B)前記高帯域励振信号をスペクトル的に平坦化することとのうちの少なくとも1つを備える請求項1に記載の方法。
  11. 前記スペクトル的に平坦化することは、
    スペクトル的に平坦化される信号に基づいて複数のフィルタ係数を計算することと、
    前記スペクトル的に平坦化される信号を、前記複数のフィルタ係数に従って構成されるホワイトニングフィルタを用いて平坦化することと
    を備える請求項10に記載の方法。
  12. 符号化された音声信号内の情報の決定論的な関数に従って前記雑音信号を生成することを備える請求項1に記載の方法。
  13. 前記結合することは、前記変調雑音信号と前記高調波拡張信号との加重和を計算することを含み、前記高帯域励振信号は、前記加重和に基づく請求項1に記載の方法。
  14. 前記加重和を計算することは、第1の重み付け係数に従って前記高調波拡張信号を重み付けすることと、第2の重み付け係数に従って前記変調雑音信号を重み付けすることとを含み、
    前記方法は、時間変動条件に従って、前記第1の重み付け係数と前記第2の重み付け係数とのうちの一方を計算することと、前記第1の重み付け係数と前記第2の重み付け係数とのエネルギーの合計が時間にわたって実質的に一定になるように、前記第1の重み付け係数と前記第2の重み付け係数とのうちの他方を計算することとを備える請求項1に記載の方法。
  15. 前記加重和を計算することは、第1の重み付け係数に従って前記高調波拡張信号を重み付けすることと、第2の重み付け係数に従って前記変調雑音信号を重み付けすることとを含み、
    前記方法は、(A)音声信号の周期性の測定と、(B)音声信号のうちの発声度合いとのうちの少なくとも1つに従って、前記第1の重み付け係数と前記第2の重み付け係数とのうちの少なくとも1つを計算することを含む請求項1に記載の方法。
  16. 量子化された低帯域残留表示から、前記低帯域励振信号とピッチ利得値とを取得することと、
    少なくとも前記ピッチ利得値に従って、前記第1の重み付け係数と前記第2の重み付け係数とのうちの一方を計算することと
    を備える請求項15に記載の方法。
  17. (i)前記高帯域励振信号に従って高帯域音声信号を符合化することと、(ii)前記高帯域励振信号に従って高帯域音声信号を復号することとのうちの少なくとも1つを備える請求項1に記載の方法。
  18. 請求項1に記載の信号処理の方法を記述する計算機実行可能命令を有するデータ記憶媒体。
  19. 低帯域励振信号に基づく信号のスペクトルの高調波拡張を実行するように構成されたスペクトル拡張器と、
    前記低帯域励振信号に基づく信号の時間領域エンベロープを計算するように構成されたエンベロープ計算器と、
    前記時間領域エンベロープに従って雑音信号を変調するように構成された第1の結合器と、
    (A)前記高調波拡張の結果に基づく高調波拡張信号と、(B)前記変調の結果に基づく変調雑音信号との合計を計算するように構成された第2の結合器とを備え、
    前記高帯域励振信号は、前記合計の結果に基づく装置。
  20. 前記スペクトル拡張器は、前記低帯域励振信号に基づく信号のスペクトルの高調波拡張を行うために非線形関数を適用するように構成された請求項19に記載の装置。
  21. 前記非線形関数は、絶対値関数、平方関数、及びクリッピング関数のうちの少なくとも1つを備える請求項20に記載の装置。
  22. 前記非線形関数は、絶対値関数である請求項20に記載の装置。
  23. 前記エンベロープ計算器は、前記低帯域励振信号、前記低帯域励振信号に基づく低帯域音声信号、及び、前記高調波拡張信号のうちの1つに基づいて前記時間領域エンベロープを計算するように構成された請求項19に記載の装置。
  24. 前記スペクトル拡張器は、前記低帯域励振信号に基づくアップサンプルされた信号のスペクトルの高調波拡張を実行するように構成された請求項19に記載の装置。
  25. 前記高調波拡張信号と前記高帯域励振信号とのうちの少なくとも1つをスペクトル的に平坦化するように構成されたスペクトル平坦化部を備える請求項19に記載の装置。
  26. 前記スペクトル平坦化部は、スペクトル的に平坦化される信号に基づいて複数のフィルタ係数を計算し、かつ、前記スペクトル的に平坦化される信号を、前記複数のフィルタ係数に従って構成されるホワイトニングフィルタを用いて平坦化するように構成された請求項25に記載の装置。
  27. 符号化された音声信号内の情報の決定論的な関数に従って前記雑音信号を生成するように構成された雑音生成器を備える請求項19に記載の装置。
  28. 前記第2の結合器は、前記変調雑音信号と前記高調波拡張信号との加重和を計算するように構成され、前記高帯域励振信号は、前記加重和に基づく請求項19に記載の装置。
  29. 前記第2の結合器は、第1の重み付け係数に従って前記高調波拡張信号を重み付けし、かつ、第2の重み付け係数に従って前記変調雑音信号を重み付けするように構成され、
    前記第2の結合器は、時間変動条件に従って、前記第1の重み付け係数と前記第2の重み付け係数とのうちの一方を計算するように構成され、
    前記第2の結合器は、前記第1の重み付け係数と前記第2の重み付け係数とのエネルギーの合計が時間にわたって実質的に一定になるように、前記第1の重み付け係数と前記第2の重み付け係数とのうちの他方を計算するように構成された請求項28に記載の装置。
  30. 前記第2の結合器は、第1の重み付け係数に従って前記高調波拡張信号を重み付けし、かつ、第2の重み付け係数に従って前記変調雑音信号を重み付けするように構成され、
    前記第2の結合器は、(A)音声信号の周期性の測定と、(B)音声信号のうちの発声度合いとのうちの少なくとも1つに従って、前記第1の重み付け係数と前記第2の重み付け係数とのうちの少なくとも1つを計算するように構成された請求項19に記載の装置。
  31. 量子化された低帯域残留表示から、前記低帯域励振信号とピッチ利得値とを取得するように構成された逆量子化器を含み、
    前記第2の結合器は、少なくとも前記ピッチ利得値に従って、前記第1の重み付け係数と前記第2の重み付け係数とのうちの少なくとも一方を計算するように構成された請求項30に記載の装置。
  32. (i)前記高帯域励振信号に従って高帯域音声信号を符合化するように構成された高帯域音声符号器と、(ii)前記高帯域励振信号に従って高帯域音声信号を復号するように構成された高帯域音声復号器とのうちの少なくとも1つを含む請求項19に記載の装置。
  33. セルラ電話を備える請求項19に記載の装置。
  34. インターネットプロトコルのバージョンに準拠した複数のパケットを送信するように構成されたデバイスを備え、前記複数のパケットは、狭帯域励振信号を記述する請求項19に記載の装置。
  35. インターネットプロトコルのバージョンに準拠した複数のパケットを受信するように構成されたデバイスを備え、前記複数のパケットは、狭帯域励振信号を記述する請求項19に記載の装置。
  36. 低帯域励振信号に基づく信号のスペクトルを高調波拡張する手段と、
    前記低帯域励振信号に基づく信号の時間領域エンベロープを計算する手段と、
    前記時間領域エンベロープに従って雑音信号を変調する手段と、
    (A)前記高調波拡張の結果に基づく高調波拡張信号と、(B)前記変調の結果に基づく変調雑音信号とを結合する手段とを備え、
    前記高帯域励振信号は、前記結合の結果に基づく装置。
  37. セルラ電話を備える請求項36に記載の装置。
  38. 高帯域励振信号を生成する方法であって、
    音声信号の低周波数部分から導かれる低帯域励振信号に非線形関数を適用することによって高調波拡張信号を計算することと、
    前記高調波拡張信号を変調雑音信号と混合して高帯域励振信号を生成することと
    を備える方法。
  39. 前記非線形関数は絶対値関数である請求項38に記載の方法。
  40. 前記低帯域励振信号、前記低帯域励振信号に基づく低帯域音声信号、及び、前記高調波拡張信号のうちの1つの時間領域エンベロープに従って雑音信号を変調することによって前記変調雑音信号を計算することを備える請求項38に記載の方法。
  41. 前記混合することは、前記変調雑音信号と前記高調波拡張信号との加重和を計算することを含み、前記高帯域励振信号は、前記加重和に基づく請求項38に記載の方法。
  42. (i)前記高帯域励振信号に従って音声信号の高帯域部分を符合化することと、(ii)前記高帯域励振信号に従って音声信号の高帯域部分を復号することとのうちの少なくとも1つを備える請求項38に記載の方法。
JP2008504481A 2005-04-01 2006-04-03 高帯域励振生成のためのシステム、方法、及び装置 Active JP4955649B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US66790105P 2005-04-01 2005-04-01
US60/667,901 2005-04-01
US67396505P 2005-04-22 2005-04-22
US60/673,965 2005-04-22
PCT/US2006/012234 WO2006130221A1 (en) 2005-04-01 2006-04-03 Systems, methods, and apparatus for highband excitation generation

Publications (2)

Publication Number Publication Date
JP2008535027A true JP2008535027A (ja) 2008-08-28
JP4955649B2 JP4955649B2 (ja) 2012-06-20

Family

ID=36588741

Family Applications (8)

Application Number Title Priority Date Filing Date
JP2008504481A Active JP4955649B2 (ja) 2005-04-01 2006-04-03 高帯域励振生成のためのシステム、方法、及び装置
JP2008504482A Active JP5161069B2 (ja) 2005-04-01 2006-04-03 広帯域音声符号化のためのシステム、方法、及び装置
JP2008504478A Active JP5129117B2 (ja) 2005-04-01 2006-04-03 音声信号の高帯域部分を符号化及び復号する方法及び装置
JP2008504479A Active JP5203930B2 (ja) 2005-04-01 2006-04-03 高帯域時間軸伸縮を行うシステム、方法、および装置
JP2008504480A Active JP5129118B2 (ja) 2005-04-01 2006-04-03 帯域幅拡張音声予測励振信号の反疎性フィルタリングのための方法及び装置
JP2008504474A Active JP5203929B2 (ja) 2005-04-01 2006-04-03 スペクトルエンベロープ表示のベクトル量子化方法及び装置
JP2008504475A Active JP5129115B2 (ja) 2005-04-01 2006-04-03 高帯域バーストの抑制のためのシステム、方法、および装置
JP2008504477A Active JP5129116B2 (ja) 2005-04-01 2006-04-03 音声信号を帯域分割符号化する方法及び装置

Family Applications After (7)

Application Number Title Priority Date Filing Date
JP2008504482A Active JP5161069B2 (ja) 2005-04-01 2006-04-03 広帯域音声符号化のためのシステム、方法、及び装置
JP2008504478A Active JP5129117B2 (ja) 2005-04-01 2006-04-03 音声信号の高帯域部分を符号化及び復号する方法及び装置
JP2008504479A Active JP5203930B2 (ja) 2005-04-01 2006-04-03 高帯域時間軸伸縮を行うシステム、方法、および装置
JP2008504480A Active JP5129118B2 (ja) 2005-04-01 2006-04-03 帯域幅拡張音声予測励振信号の反疎性フィルタリングのための方法及び装置
JP2008504474A Active JP5203929B2 (ja) 2005-04-01 2006-04-03 スペクトルエンベロープ表示のベクトル量子化方法及び装置
JP2008504475A Active JP5129115B2 (ja) 2005-04-01 2006-04-03 高帯域バーストの抑制のためのシステム、方法、および装置
JP2008504477A Active JP5129116B2 (ja) 2005-04-01 2006-04-03 音声信号を帯域分割符号化する方法及び装置

Country Status (24)

Country Link
US (8) US8484036B2 (ja)
EP (8) EP1866914B1 (ja)
JP (8) JP4955649B2 (ja)
KR (8) KR100956524B1 (ja)
CN (1) CN102411935B (ja)
AT (4) ATE492016T1 (ja)
AU (8) AU2006232363B2 (ja)
BR (8) BRPI0608305B1 (ja)
CA (8) CA2603187C (ja)
DE (4) DE602006012637D1 (ja)
DK (2) DK1864101T3 (ja)
ES (3) ES2340608T3 (ja)
HK (5) HK1113848A1 (ja)
IL (8) IL186442A (ja)
MX (8) MX2007012185A (ja)
NO (7) NO20075510L (ja)
NZ (6) NZ562182A (ja)
PL (4) PL1869673T3 (ja)
PT (2) PT1864101E (ja)
RU (9) RU2402826C2 (ja)
SG (4) SG163556A1 (ja)
SI (1) SI1864282T1 (ja)
TW (8) TWI320923B (ja)
WO (8) WO2006107833A1 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012027255A (ja) * 2010-07-23 2012-02-09 Oki Electric Ind Co Ltd 帯域拡張装置及びプログラム、並びに、音声通信装置
JP2012529068A (ja) * 2009-06-01 2012-11-15 華為技術有限公司 圧縮符号化および復号の方法、符号器、復号器、ならびに符号化装置
JP2013511742A (ja) * 2009-11-19 2013-04-04 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 改良された励起信号帯域幅拡張
JP2013525833A (ja) * 2010-04-16 2013-06-20 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. ガイドされた帯域幅拡張およびブラインド帯域幅拡張を用いて広帯域信号を生成するため装置、方法およびコンピュータプログラム
KR101484426B1 (ko) 2010-10-15 2015-01-19 모토로라 모빌리티 엘엘씨 Celp 기반 음성 코더에서의 오디오 신호 대역폭 확장
JP2016507783A (ja) * 2013-02-08 2016-03-10 クゥアルコム・インコーポレイテッドQualcomm Incorporated ノイズ変調とゲイン調整とを実行するシステムおよび方法
JP2016532912A (ja) * 2013-10-14 2016-10-20 クゥアルコム・インコーポレイテッドQualcomm Incorporated スケーリングされた高帯域励磁を使用する音声信号の帯域幅拡張のための方法、装置、デバイス、コンピュータ可読媒体
JP2016532886A (ja) * 2013-10-11 2016-10-20 クゥアルコム・インコーポレイテッドQualcomm Incorporated ハイバンド励振信号を生成するための混合係数の推定
JP2017515143A (ja) * 2014-03-31 2017-06-08 クゥアルコム・インコーポレイテッドQualcomm Incorporated 複数のサブバンドを使用するハイバンド信号コーディング
JP2017523461A (ja) * 2014-06-26 2017-08-17 クゥアルコム・インコーポレイテッドQualcomm Incorporated 不一致周波数範囲を使用するハイバンド信号コーディング

Families Citing this family (312)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7987095B2 (en) * 2002-09-27 2011-07-26 Broadcom Corporation Method and system for dual mode subband acoustic echo canceller with integrated noise suppression
US7619995B1 (en) * 2003-07-18 2009-11-17 Nortel Networks Limited Transcoders and mixers for voice-over-IP conferencing
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
EP3336843B1 (en) * 2004-05-14 2021-06-23 Panasonic Intellectual Property Corporation of America Speech coding method and speech coding apparatus
EP1775717B1 (en) * 2004-07-20 2013-09-11 Panasonic Corporation Speech decoding apparatus and compensation frame generation method
MY149811A (en) * 2004-08-30 2013-10-14 Qualcomm Inc Method and apparatus for an adaptive de-jitter buffer
US8085678B2 (en) * 2004-10-13 2011-12-27 Qualcomm Incorporated Media (voice) playback (de-jitter) buffer adjustments based on air interface
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US8355907B2 (en) * 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
WO2006103488A1 (en) * 2005-03-30 2006-10-05 Nokia Corporation Source coding and/or decoding
WO2006107833A1 (en) 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for vector quantizing of a spectral envelope representation
US9043214B2 (en) * 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation
ATE435481T1 (de) * 2005-04-28 2009-07-15 Siemens Ag Verfahren und vorrichtung zur geräuschunterdrückung
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
WO2007007253A1 (en) * 2005-07-14 2007-01-18 Koninklijke Philips Electronics N.V. Audio signal synthesis
US8169890B2 (en) * 2005-07-20 2012-05-01 Qualcomm Incorporated Systems and method for high data rate ultra wideband communication
KR101171098B1 (ko) * 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
CA2558595C (en) * 2005-09-02 2015-05-26 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
US8326614B2 (en) * 2005-09-02 2012-12-04 Qnx Software Systems Limited Speech enhancement system
BRPI0616624A2 (pt) * 2005-09-30 2011-06-28 Matsushita Electric Ind Co Ltd aparelho de codificação de fala e método de codificação de fala
CN102623014A (zh) * 2005-10-14 2012-08-01 松下电器产业株式会社 变换编码装置和变换编码方法
US7991611B2 (en) * 2005-10-14 2011-08-02 Panasonic Corporation Speech encoding apparatus and speech encoding method that encode speech signals in a scalable manner, and speech decoding apparatus and speech decoding method that decode scalable encoded signals
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8532984B2 (en) 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
DE602007014059D1 (de) 2006-08-15 2011-06-01 Broadcom Corp Zeitverschiebung eines dekodierten audiosignals nach einem paketverlust
US8706507B2 (en) 2006-08-15 2014-04-22 Dolby Laboratories Licensing Corporation Arbitrary shaping of temporal noise envelope without side-information utilizing unchanged quantization
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US8046218B2 (en) * 2006-09-19 2011-10-25 The Board Of Trustees Of The University Of Illinois Speech and method for identifying perceptual features
JP4972742B2 (ja) * 2006-10-17 2012-07-11 国立大学法人九州工業大学 高域信号補間方法及び高域信号補間装置
EP4325724A3 (en) 2006-10-25 2024-04-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio subband values
KR101375582B1 (ko) 2006-11-17 2014-03-20 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101565919B1 (ko) 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
US8005671B2 (en) * 2006-12-04 2011-08-23 Qualcomm Incorporated Systems and methods for dynamic normalization to reduce loss in precision for low-level signals
GB2444757B (en) * 2006-12-13 2009-04-22 Motorola Inc Code excited linear prediction speech coding
US20080147389A1 (en) * 2006-12-15 2008-06-19 Motorola, Inc. Method and Apparatus for Robust Speech Activity Detection
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US7873064B1 (en) * 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
US8032359B2 (en) 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
DK3401907T3 (da) 2007-08-27 2020-03-02 Ericsson Telefon Ab L M Fremgangsmåde og indretning til perceptuel spektral afkodning af et audiosignal omfattende udfyldning af spektrale huller
FR2920545B1 (fr) * 2007-09-03 2011-06-10 Univ Sud Toulon Var Procede de trajectographie de plusieurs cetaces par acoustique passive
JP5547081B2 (ja) * 2007-11-02 2014-07-09 華為技術有限公司 音声復号化方法及び装置
BRPI0722269A2 (pt) * 2007-11-06 2014-04-22 Nokia Corp Encodificador para encodificar um sinal de áudio, método para encodificar um sinal de áudio; decodificador para decodificar um sinal de áudio; método para decodificar um sinal de áudio; aparelho; dispositivo eletrônico; produto de programa de comoputador configurado para realizar um método para encodificar e para decodificar um sinal de áudio
US20100250260A1 (en) * 2007-11-06 2010-09-30 Lasse Laaksonen Encoder
US20100274555A1 (en) * 2007-11-06 2010-10-28 Lasse Laaksonen Audio Coding Apparatus and Method Thereof
KR101444099B1 (ko) * 2007-11-13 2014-09-26 삼성전자주식회사 음성 구간 검출 방법 및 장치
AU2008326956B2 (en) * 2007-11-21 2011-02-17 Lg Electronics Inc. A method and an apparatus for processing a signal
US8050934B2 (en) * 2007-11-29 2011-11-01 Texas Instruments Incorporated Local pitch control based on seamless time scale modification and synchronized sampling rate conversion
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
TWI356399B (en) * 2007-12-14 2012-01-11 Ind Tech Res Inst Speech recognition system and method with cepstral
KR101439205B1 (ko) * 2007-12-21 2014-09-11 삼성전자주식회사 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치
US20100280833A1 (en) * 2007-12-27 2010-11-04 Panasonic Corporation Encoding device, decoding device, and method thereof
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
EP2255534B1 (en) * 2008-03-20 2017-12-20 Samsung Electronics Co., Ltd. Apparatus and method for encoding using bandwidth extension in portable terminal
WO2010003068A1 (en) * 2008-07-03 2010-01-07 The Board Of Trustees Of The University Of Illinois Systems and methods for identifying speech sound features
CA2729751C (en) * 2008-07-10 2017-10-24 Voiceage Corporation Device and method for quantizing and inverse quantizing lpc filters in a super-frame
ES2372014T3 (es) * 2008-07-11 2012-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral.
CN103000186B (zh) 2008-07-11 2015-01-14 弗劳恩霍夫应用研究促进协会 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
WO2010011963A1 (en) * 2008-07-25 2010-01-28 The Board Of Trustees Of The University Of Illinois Methods and systems for identifying speech sounds using multi-dimensional analysis
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
WO2010028297A1 (en) 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
US8515747B2 (en) * 2008-09-06 2013-08-20 Huawei Technologies Co., Ltd. Spectrum harmonic/noise sharpness control
US8407046B2 (en) * 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US20100070550A1 (en) * 2008-09-12 2010-03-18 Cardinal Health 209 Inc. Method and apparatus of a sensor amplifier configured for use in medical applications
KR101178801B1 (ko) * 2008-12-09 2012-08-31 한국전자통신연구원 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
EP2224433B1 (en) * 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
EP2182513B1 (en) * 2008-11-04 2013-03-20 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
DE102008058496B4 (de) * 2008-11-21 2010-09-09 Siemens Medical Instruments Pte. Ltd. Filterbanksystem mit spezifischen Sperrdämpfungsanteilen für eine Hörvorrichtung
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466674B (en) * 2009-01-06 2013-11-13 Skype Speech coding
AU2010205583B2 (en) 2009-01-16 2013-02-07 Dolby International Ab Cross product enhanced harmonic transposition
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
WO2010111876A1 (zh) * 2009-03-31 2010-10-07 华为技术有限公司 一种信号去噪的方法和装置及音频解码系统
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP4921611B2 (ja) * 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US8805680B2 (en) * 2009-05-19 2014-08-12 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding audio signal using layered sinusoidal pulse coding
US8000485B2 (en) * 2009-06-01 2011-08-16 Dts, Inc. Virtual audio processing for loudspeaker or headphone playback
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
WO2011029484A1 (en) * 2009-09-14 2011-03-17 Nokia Corporation Signal enhancement processing
US9595257B2 (en) * 2009-09-28 2017-03-14 Nuance Communications, Inc. Downsampling schemes in a hierarchical neural network structure for phoneme recognition
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
WO2011048099A1 (en) 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule
PL2800094T3 (pl) * 2009-10-21 2018-03-30 Dolby International Ab Nadpróbkowanie w banku filtrów z połączonym modułem transpozycji
WO2011048792A1 (ja) * 2009-10-21 2011-04-28 パナソニック株式会社 音響信号処理装置、音響符号化装置および音響復号装置
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
CN102612712B (zh) * 2009-11-19 2014-03-12 瑞典爱立信有限公司 低频带音频信号的带宽扩展
US8489393B2 (en) * 2009-11-23 2013-07-16 Cambridge Silicon Radio Limited Speech intelligibility
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
RU2464651C2 (ru) * 2009-12-22 2012-10-20 Общество с ограниченной ответственностью "Спирит Корп" Способ и устройство многоуровневого масштабируемого устойчивого к информационным потерям кодирования речи для сетей с коммутацией пакетов
US8559749B2 (en) * 2010-01-06 2013-10-15 Streaming Appliances, Llc Audiovisual content delivery system
US8326607B2 (en) * 2010-01-11 2012-12-04 Sony Ericsson Mobile Communications Ab Method and arrangement for enhancing speech quality
KR101336051B1 (ko) 2010-01-12 2013-12-04 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 정보 인코딩 방법, 오디오 정보 디코딩 방법, 및 수치적 이전 콘텍스트 값의 수치 표현의 수정을 이용하는 컴퓨터 프로그램
US8699727B2 (en) 2010-01-15 2014-04-15 Apple Inc. Visually-assisted mixing of audio using a spectral analyzer
US9525569B2 (en) * 2010-03-03 2016-12-20 Skype Enhanced circuit-switched calls
MX2012010469A (es) * 2010-03-10 2012-12-10 Dolby Int Ab Decodificador de señales de audio, codificador de señales de audio, metodos y programa de computacion que utiliza tasa de muestreo dependiente de la codificacion del contorno de distorsion en el tiempo.
US8700391B1 (en) * 2010-04-01 2014-04-15 Audience, Inc. Low complexity bandwidth expansion of speech
CN102870156B (zh) * 2010-04-12 2015-07-22 飞思卡尔半导体公司 音频通信设备、输出音频信号的方法和通信系统
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
MX2012011802A (es) * 2010-04-13 2013-02-26 Fraunhofer Ges Forschung Metodo y codificador y descodificador para la presentacion precisa de muestra de una señal de audio.
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9443534B2 (en) * 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
CN102844810B (zh) * 2010-04-14 2017-05-03 沃伊斯亚吉公司 用于在码激励线性预测编码器和解码器中使用的灵活和可缩放的组合式创新代码本
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9378754B1 (en) 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
KR101660843B1 (ko) * 2010-05-27 2016-09-29 삼성전자주식회사 Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
ES2372202B2 (es) * 2010-06-29 2012-08-08 Universidad De Málaga Sistema de reconocimiento de sonidos de bajo consumo.
PL3079152T3 (pl) 2010-07-02 2018-10-31 Dolby International Ab Dekodowanie audio z selektywnym późniejszym filtrowaniem
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
JP5589631B2 (ja) * 2010-07-15 2014-09-17 富士通株式会社 音声処理装置、音声処理方法および電話装置
WO2012008891A1 (en) * 2010-07-16 2012-01-19 Telefonaktiebolaget L M Ericsson (Publ) Audio encoder and decoder and methods for encoding and decoding an audio signal
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US20130310422A1 (en) 2010-09-01 2013-11-21 The General Hospital Corporation Reversal of general anesthesia by administration of methylphenidate, amphetamine, modafinil, amantadine, and/or caffeine
KR101744621B1 (ko) 2010-09-16 2017-06-09 돌비 인터네셔널 에이비 교차 곱 강화된 서브밴드 블록 기반 고조파 전위
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
WO2012053149A1 (ja) * 2010-10-22 2012-04-26 パナソニック株式会社 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
PT3239978T (pt) 2011-02-14 2019-04-02 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
MX2013009303A (es) 2011-02-14 2013-09-13 Fraunhofer Ges Forschung Codec de audio utilizando sintesis de ruido durante fases inactivas.
RU2630390C2 (ru) 2011-02-14 2017-09-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для маскирования ошибок при стандартизированном кодировании речи и аудио с низкой задержкой (usac)
AR085222A1 (es) 2011-02-14 2013-09-18 Fraunhofer Ges Forschung Representacion de señal de informacion utilizando transformada superpuesta
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
MY167776A (en) * 2011-02-14 2018-09-24 Fraunhofer Ges Forschung Noise generation in audio codecs
KR101699898B1 (ko) 2011-02-14 2017-01-25 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 스펙트럼 영역에서 디코딩된 오디오 신호를 처리하기 위한 방법 및 장치
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
EP4243017A3 (en) 2011-02-14 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
RU2562771C2 (ru) * 2011-02-16 2015-09-10 Долби Лабораторис Лайсэнзин Корпорейшн Способы и системы генерирования коэффициентов фильтра и конфигурирования фильтров
DK3998607T3 (da) * 2011-02-18 2024-04-15 Ntt Docomo Inc Taleafkoder
US9165558B2 (en) 2011-03-09 2015-10-20 Dts Llc System for dynamically creating and rendering audio objects
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
US9298287B2 (en) 2011-03-31 2016-03-29 Microsoft Technology Licensing, Llc Combined activation for natural user interface systems
US9842168B2 (en) 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
US9244984B2 (en) 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
CN102811034A (zh) 2011-05-31 2012-12-05 财团法人工业技术研究院 信号处理装置及信号处理方法
US9264094B2 (en) * 2011-06-09 2016-02-16 Panasonic Intellectual Property Corporation Of America Voice coding device, voice decoding device, voice coding method and voice decoding method
US9070361B2 (en) 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
BR112013033900B1 (pt) 2011-06-30 2022-03-15 Samsung Electronics Co., Ltd Método para gerar um sinal estendido de largura de banda para decodificação de áudio
US9059786B2 (en) * 2011-07-07 2015-06-16 Vecima Networks Inc. Ingress suppression for communication systems
JP5942358B2 (ja) * 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
RU2486636C1 (ru) * 2011-11-14 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации высокочастотных сигналов и устройство его реализации
RU2486637C1 (ru) * 2011-11-15 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2486638C1 (ru) * 2011-11-15 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации высокочастотных сигналов и устройство его реализации
RU2496222C2 (ru) * 2011-11-17 2013-10-20 Федеральное государственное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2486639C1 (ru) * 2011-11-21 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2496192C2 (ru) * 2011-11-21 2013-10-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2490727C2 (ru) * 2011-11-28 2013-08-20 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Уральский государственный университет путей сообщения" (УрГУПС) Способ передачи речевых сигналов (варианты)
RU2487443C1 (ru) * 2011-11-29 2013-07-10 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ согласования комплексных сопротивлений и устройство его реализации
JP5817499B2 (ja) * 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
US9972325B2 (en) * 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
US9082398B2 (en) * 2012-02-28 2015-07-14 Huawei Technologies Co., Ltd. System and method for post excitation enhancement for low bit rate speech coding
US9437213B2 (en) * 2012-03-05 2016-09-06 Malaspina Labs (Barbados) Inc. Voice signal enhancement
ES2762325T3 (es) 2012-03-21 2020-05-22 Samsung Electronics Co Ltd Procedimiento y aparato de codificación/decodificación de frecuencia alta para extensión de ancho de banda
FI3547261T3 (fi) 2012-03-29 2023-09-26 Ericsson Telefon Ab L M Vektorikvantisoija
US10448161B2 (en) 2012-04-02 2019-10-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field
JP5998603B2 (ja) * 2012-04-18 2016-09-28 ソニー株式会社 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム
KR101343768B1 (ko) * 2012-04-19 2014-01-16 충북대학교 산학협력단 스펙트럼 변화 패턴을 이용한 음성 및 오디오 신호 분류방법
RU2504898C1 (ru) * 2012-05-17 2014-01-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации
RU2504894C1 (ru) * 2012-05-17 2014-01-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации
US20140006017A1 (en) * 2012-06-29 2014-01-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal
DK2891151T3 (en) * 2012-08-31 2016-12-12 ERICSSON TELEFON AB L M (publ) Method and device for detection of voice activity
EP2898506B1 (en) 2012-09-21 2018-01-17 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
WO2014062859A1 (en) * 2012-10-16 2014-04-24 Audiologicall, Ltd. Audio signal manipulation for speech enhancement before sound reproduction
KR101413969B1 (ko) 2012-12-20 2014-07-08 삼성전자주식회사 오디오 신호의 복호화 방법 및 장치
CN105551497B (zh) 2013-01-15 2019-03-19 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
PL3054446T3 (pl) * 2013-01-29 2024-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio, dekoder audio, sposób dostarczania kodowanej informacji audio, sposób dostarczania zdekodowanej informacji audio, program komputerowy i kodowana reprezentacja, stosujące adaptacyjne względem sygnału rozszerzenie szerokości pasma
RU2618919C2 (ru) * 2013-01-29 2017-05-12 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для синтезирования аудиосигнала, декодер, кодер, система и компьютерная программа
CN103971693B (zh) 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
US20140213909A1 (en) * 2013-01-31 2014-07-31 Xerox Corporation Control-based inversion for estimating a biological parameter vector for a biophysics model from diffused reflectance data
US9711156B2 (en) 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
US9741350B2 (en) * 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
US9336789B2 (en) * 2013-02-21 2016-05-10 Qualcomm Incorporated Systems and methods for determining an interpolation factor set for synthesizing a speech signal
US9715885B2 (en) * 2013-03-05 2017-07-25 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program
EP2784775B1 (en) * 2013-03-27 2016-09-14 Binauric SE Speech signal encoding/decoding method and apparatus
CA3029033C (en) 2013-04-05 2021-03-30 Dolby International Ab Audio encoder and decoder
CN105264600B (zh) 2013-04-05 2019-06-07 Dts有限责任公司 分层音频编码和传输
CN117253498A (zh) * 2013-04-05 2023-12-19 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
RU2665253C2 (ru) * 2013-06-21 2018-08-28 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для улучшенного маскирования адаптивной таблицы кодирования при acelp-образном маскировании с использованием улучшенной оценки запаздывания основного тона
BR112015031605B1 (pt) 2013-06-21 2022-03-29 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Decodificador de áudio tendo um módulo de extensão de largura de banda com um módulo de ajuste de energia
FR3007563A1 (fr) * 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
EP3014290A4 (en) 2013-06-27 2017-03-08 The General Hospital Corporation Systems and methods for tracking non-stationary spectral structure and dynamics in physiological data
WO2014210527A1 (en) * 2013-06-28 2014-12-31 The General Hospital Corporation System and method to infer brain state during burst suppression
CN104282308B (zh) 2013-07-04 2017-07-14 华为技术有限公司 频域包络的矢量量化方法和装置
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2830054A1 (en) * 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
EP3503095A1 (en) 2013-08-28 2019-06-26 Dolby Laboratories Licensing Corp. Hybrid waveform-coded and parametric-coded speech enhancement
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
EP4166072A1 (en) 2013-09-13 2023-04-19 The General Hospital Corporation Systems and methods for improved brain monitoring during general anesthesia and sedation
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
CN108172239B (zh) * 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
CN104517611B (zh) 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
US9224402B2 (en) 2013-09-30 2015-12-29 International Business Machines Corporation Wideband speech parameterization for high quality synthesis, transformation and quantization
US9620134B2 (en) * 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
KR102271852B1 (ko) 2013-11-02 2021-07-01 삼성전자주식회사 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
EP2871641A1 (en) * 2013-11-12 2015-05-13 Dialog Semiconductor B.V. Enhancement of narrowband audio signals using a single sideband AM modulation
CN105765655A (zh) 2013-11-22 2016-07-13 高通股份有限公司 高频带译码中的选择性相位补偿
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
WO2015098564A1 (ja) 2013-12-27 2015-07-02 ソニー株式会社 復号化装置および方法、並びにプログラム
CN103714822B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 基于silk编解码器的子带编解码方法及装置
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
US9564141B2 (en) 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
JP6281336B2 (ja) * 2014-03-12 2018-02-21 沖電気工業株式会社 音声復号化装置及びプログラム
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
RU2689181C2 (ru) * 2014-03-31 2019-05-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, способ кодирования, способ декодирования и программа
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN105336336B (zh) 2014-06-12 2016-12-28 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
CN107424622B (zh) 2014-06-24 2020-12-25 华为技术有限公司 音频编码方法和装置
US9583115B2 (en) * 2014-06-26 2017-02-28 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic
CN106486129B (zh) * 2014-06-27 2019-10-25 华为技术有限公司 一种音频编码方法和装置
US9721584B2 (en) * 2014-07-14 2017-08-01 Intel IP Corporation Wind noise reduction for audio reception
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980798A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
WO2016024853A1 (ko) * 2014-08-15 2016-02-18 삼성전자 주식회사 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기
CN104217730B (zh) * 2014-08-18 2017-07-21 大连理工大学 一种基于k‑svd的人工语音带宽扩展方法及装置
US9978388B2 (en) 2014-09-12 2018-05-22 Knowles Electronics, Llc Systems and methods for restoration of speech components
TWI550945B (zh) * 2014-12-22 2016-09-21 國立彰化師範大學 具有急遽過渡帶的複合濾波器之設計方法及其串聯式複合濾波器
US9595269B2 (en) * 2015-01-19 2017-03-14 Qualcomm Incorporated Scaling for gain shape circuitry
DE112016000545B4 (de) 2015-01-30 2019-08-22 Knowles Electronics, Llc Kontextabhängiges schalten von mikrofonen
ES2837107T3 (es) 2015-02-26 2021-06-29 Fraunhofer Ges Forschung Aparato y método para procesar una señal de audio para obtener una señal de audio procesada usando una envolvente en el dominio del tiempo objetivo
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US9407989B1 (en) 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
US9830921B2 (en) * 2015-08-17 2017-11-28 Qualcomm Incorporated High-band target signal control
NO20151400A1 (en) 2015-10-15 2017-01-23 St Tech As A system for isolating an object
WO2017064264A1 (en) * 2015-10-15 2017-04-20 Huawei Technologies Co., Ltd. Method and appratus for sinusoidal encoding and decoding
MX371223B (es) 2016-02-17 2020-01-09 Fraunhofer Ges Forschung Post-procesador, pre-procesador, codificador de audio, decodificador de audio y metodos relacionados para mejorar el procesamiento de transitorios.
FR3049084B1 (fr) 2016-03-15 2022-11-11 Fraunhofer Ges Forschung Dispositif de codage pour le traitement d'un signal d'entree et dispositif de decodage pour le traitement d'un signal code
ES2808997T3 (es) * 2016-04-12 2021-03-02 Fraunhofer Ges Forschung Codificador de audio para codificar una señal de audio, método para codificar una señal de audio y programa informático en consideración de una región espectral del pico detectada en una banda de frecuencia superior
US10770088B2 (en) * 2016-05-10 2020-09-08 Immersion Networks, Inc. Adaptive audio decoder system, method and article
US10756755B2 (en) * 2016-05-10 2020-08-25 Immersion Networks, Inc. Adaptive audio codec system, method and article
CN109416913B (zh) * 2016-05-10 2024-03-15 易默森服务有限责任公司 自适应音频编解码系统、方法、装置及介质
US10699725B2 (en) * 2016-05-10 2020-06-30 Immersion Networks, Inc. Adaptive audio encoder system, method and article
US20170330575A1 (en) * 2016-05-10 2017-11-16 Immersion Services LLC Adaptive audio codec system, method and article
US10264116B2 (en) * 2016-11-02 2019-04-16 Nokia Technologies Oy Virtual duplex operation
KR102507383B1 (ko) * 2016-11-08 2023-03-08 한국전자통신연구원 직사각형 윈도우를 이용한 스테레오 정합 방법 및 스테레오 정합 시스템
US10786168B2 (en) 2016-11-29 2020-09-29 The General Hospital Corporation Systems and methods for analyzing electrophysiological data from patients undergoing medical treatments
ES2950009T3 (es) 2017-01-06 2023-10-04 Ericsson Telefon Ab L M Métodos y aparatos para señalizar y determinar desplazamientos de señal de referencia
KR20180092582A (ko) * 2017-02-10 2018-08-20 삼성전자주식회사 Wfst 디코딩 시스템, 이를 포함하는 음성 인식 시스템 및 wfst 데이터 저장 방법
US10553222B2 (en) * 2017-03-09 2020-02-04 Qualcomm Incorporated Inter-channel bandwidth extension spectral mapping and adjustment
US10304468B2 (en) * 2017-03-20 2019-05-28 Qualcomm Incorporated Target sample generation
TW202341126A (zh) * 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
JP7057428B2 (ja) * 2017-10-27 2022-04-19 テラウェーブ,エルエルシー 符号化正弦波形を使用する高スペクトル効率データ通信システムの受信器
US11876659B2 (en) 2017-10-27 2024-01-16 Terawave, Llc Communication system using shape-shifted sinusoidal waveforms
CN109729553B (zh) * 2017-10-30 2021-12-28 成都鼎桥通信技术有限公司 Lte集群通信系统的语音业务处理方法及设备
EP3483883A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
US10460749B1 (en) * 2018-06-28 2019-10-29 Nuvoton Technology Corporation Voice activity detection using vocal tract area information
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
JP7088403B2 (ja) * 2019-02-20 2022-06-21 ヤマハ株式会社 音信号生成方法、生成モデルの訓練方法、音信号生成システムおよびプログラム
CN110610713B (zh) * 2019-08-28 2021-11-16 南京梧桐微电子科技有限公司 一种声码器余量谱幅度参数重构方法及系统
US11380343B2 (en) 2019-09-12 2022-07-05 Immersion Networks, Inc. Systems and methods for processing high frequency audio signal
TWI723545B (zh) * 2019-09-17 2021-04-01 宏碁股份有限公司 語音處理方法及其裝置
US11295751B2 (en) * 2019-09-20 2022-04-05 Tencent America LLC Multi-band synchronized neural vocoder
KR102201169B1 (ko) * 2019-10-23 2021-01-11 성균관대학교 산학협력단 메타 표면의 반사 계수를 제어하기 위한 시간 부호 생성 방법, 메타 표면의 반사 계수를 제어하기 위한 시공간 부호 생성 방법, 이를 실행하는 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체, 및 이를 이용한 메타 표면의 신호 변조 방법
CN114548442B (zh) * 2022-02-25 2022-10-21 万表名匠(广州)科技有限公司 一种基于互联网技术的腕表维修管理系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
EP1300833A2 (en) * 2001-10-04 2003-04-09 AT&T Corp. A method of bandwidth extension for narrow-band speech
WO2003044777A1 (en) * 2001-11-23 2003-05-30 Koninklijke Philips Electronics N.V. Audio signal bandwidth extension

Family Cites Families (145)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US526468A (en) * 1894-09-25 Charles d
US596689A (en) * 1898-01-04 Hose holder or support
US525147A (en) * 1894-08-28 Steam-cooker
US321993A (en) * 1885-07-14 Lantern
US1126620A (en) * 1911-01-30 1915-01-26 Safety Car Heating & Lighting Electric regulation.
US1089258A (en) * 1914-01-13 1914-03-03 James Arnot Paterson Facing or milling machine.
US1300833A (en) * 1918-12-12 1919-04-15 Moline Mill Mfg Company Idler-pulley structure.
US1498873A (en) * 1924-04-19 1924-06-24 Bethlehem Steel Corp Switch stand
US2073913A (en) * 1934-06-26 1937-03-16 Wigan Edmund Ramsay Means for gauging minute displacements
US2086867A (en) * 1936-06-19 1937-07-13 Hall Lab Inc Laundering composition and process
US3044777A (en) * 1959-10-19 1962-07-17 Fibermold Corp Bowling pin
US3158693A (en) * 1962-08-07 1964-11-24 Bell Telephone Labor Inc Speech interpolation communication system
US3855416A (en) 1972-12-01 1974-12-17 F Fuller Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment
US3855414A (en) 1973-04-24 1974-12-17 Anaconda Co Cable armor clamp
JPS59139099A (ja) 1983-01-31 1984-08-09 株式会社東芝 音声区間検出装置
US4616659A (en) 1985-05-06 1986-10-14 At&T Bell Laboratories Heart rate detection utilizing autoregressive analysis
US4630305A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4747143A (en) 1985-07-12 1988-05-24 Westinghouse Electric Corp. Speech enhancement system having dynamic gain control
NL8503152A (nl) * 1985-11-15 1987-06-01 Optische Ind De Oude Delft Nv Dosismeter voor ioniserende straling.
US4862168A (en) 1987-03-19 1989-08-29 Beard Terry D Audio digital/analog encoding and decoding
US4805193A (en) * 1987-06-04 1989-02-14 Motorola, Inc. Protection of energy information in sub-band coding
US4852179A (en) 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
JP2707564B2 (ja) 1987-12-14 1998-01-28 株式会社日立製作所 音声符号化方式
US5285520A (en) * 1988-03-02 1994-02-08 Kokusai Denshin Denwa Kabushiki Kaisha Predictive coding apparatus
CA1321645C (en) 1988-09-28 1993-08-24 Akira Ichikawa Method and system for voice coding based on vector quantization
US5086475A (en) 1988-11-19 1992-02-04 Sony Corporation Apparatus for generating, recording or reproducing sound source data
JPH02244100A (ja) * 1989-03-16 1990-09-28 Ricoh Co Ltd 駆動音源信号生成装置
BR9105987A (pt) 1990-09-19 1993-02-02 Philips Nv Portador de registro no qual foram registrados um arquivo de dados principais e um arquivo de controle,processo e dispositivo para registrar um arquivo de dados principais e um arquivo de controle num portador de registro,e dispositivo para ter um portador de registro
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP3191457B2 (ja) 1992-10-31 2001-07-23 ソニー株式会社 高能率符号化装置、ノイズスペクトル変更装置及び方法
JP3721582B2 (ja) 1993-06-30 2005-11-30 ソニー株式会社 信号符号化装置及び方法並びに信号復号化装置及び方法
WO1995010760A2 (en) 1993-10-08 1995-04-20 Comsat Corporation Improved low bit rate vocoders and methods of operation therefor
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5487087A (en) 1994-05-17 1996-01-23 Texas Instruments Incorporated Signal quantizer with reduced output fluctuation
US5797118A (en) 1994-08-09 1998-08-18 Yamaha Corporation Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns
JP2770137B2 (ja) 1994-09-22 1998-06-25 日本プレシジョン・サーキッツ株式会社 波形データ圧縮装置
US5699477A (en) * 1994-11-09 1997-12-16 Texas Instruments Incorporated Mixed excitation linear prediction with fractional pitch
FI97182C (fi) 1994-12-05 1996-10-25 Nokia Telecommunications Oy Menetelmä vastaanotettujen huonojen puhekehysten korvaamiseksi digitaalisessa vastaanottimessa sekä digitaalisen tietoliikennejärjestelmän vastaanotin
JP3365113B2 (ja) * 1994-12-22 2003-01-08 ソニー株式会社 音声レベル制御装置
JP3189614B2 (ja) 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
EP0732687B2 (en) * 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
JP2798003B2 (ja) 1995-05-09 1998-09-17 松下電器産業株式会社 音声帯域拡大装置および音声帯域拡大方法
JP2956548B2 (ja) 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
US6263307B1 (en) 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
JP3334419B2 (ja) * 1995-04-20 2002-10-15 ソニー株式会社 ノイズ低減方法及びノイズ低減装置
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US5704003A (en) 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
US6097824A (en) 1997-06-06 2000-08-01 Audiologic, Incorporated Continuous frequency dynamic range audio compressor
DE69530204T2 (de) * 1995-10-16 2004-03-18 Agfa-Gevaert Neue Klasse von Gelbfarbstoffen für photographische Materialien
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
US5737716A (en) * 1995-12-26 1998-04-07 Motorola Method and apparatus for encoding speech using neural network technology for speech classification
JP3073919B2 (ja) * 1995-12-30 2000-08-07 松下電器産業株式会社 同期装置
US5689615A (en) 1996-01-22 1997-11-18 Rockwell International Corporation Usage of voice activity detection for efficient coding of speech
TW307960B (en) * 1996-02-15 1997-06-11 Philips Electronics Nv Reduced complexity signal transmission system
EP0814458B1 (en) 1996-06-19 2004-09-22 Texas Instruments Incorporated Improvements in or relating to speech coding
JP3246715B2 (ja) 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
KR20030096444A (ko) * 1996-11-07 2003-12-31 마쯔시다덴기산교 가부시키가이샤 음원 벡터 생성 장치 및 방법
US6009395A (en) 1997-01-02 1999-12-28 Texas Instruments Incorporated Synthesizer and method using scaled excitation signal
US6202046B1 (en) 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
US6041297A (en) * 1997-03-10 2000-03-21 At&T Corp Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations
US5890126A (en) * 1997-03-10 1999-03-30 Euphonics, Incorporated Audio data decompression and interpolation apparatus and method
EP0878790A1 (en) 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6889185B1 (en) 1997-08-28 2005-05-03 Texas Instruments Incorporated Quantization of linear prediction coefficients using perceptual weighting
US6122384A (en) * 1997-09-02 2000-09-19 Qualcomm Inc. Noise suppression system and method
US6029125A (en) * 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
US6231516B1 (en) * 1997-10-14 2001-05-15 Vacusense, Inc. Endoluminal implant with therapeutic and diagnostic capability
JPH11205166A (ja) * 1998-01-19 1999-07-30 Mitsubishi Electric Corp ノイズ検出装置
US6301556B1 (en) 1998-03-04 2001-10-09 Telefonaktiebolaget L M. Ericsson (Publ) Reducing sparseness in coded speech signals
US6385573B1 (en) 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6449590B1 (en) 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
JP4170458B2 (ja) 1998-08-27 2008-10-22 ローランド株式会社 波形信号の時間軸圧縮伸長装置
US6353808B1 (en) 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
KR20000047944A (ko) 1998-12-11 2000-07-25 이데이 노부유끼 수신장치 및 방법과 통신장치 및 방법
JP4354561B2 (ja) 1999-01-08 2009-10-28 パナソニック株式会社 オーディオ信号符号化装置及び復号化装置
US6223151B1 (en) * 1999-02-10 2001-04-24 Telefon Aktie Bolaget Lm Ericsson Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders
JP3696091B2 (ja) 1999-05-14 2005-09-14 松下電器産業株式会社 オーディオ信号の帯域を拡張するための方法及び装置
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
JP4792613B2 (ja) 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
US6556950B1 (en) 1999-09-30 2003-04-29 Rockwell Automation Technologies, Inc. Diagnostic method and apparatus for use with enterprise control
US6715125B1 (en) 1999-10-18 2004-03-30 Agere Systems Inc. Source coding and transmission with time diversity
CN1192355C (zh) 1999-11-16 2005-03-09 皇家菲利浦电子有限公司 宽带音频传输系统
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
CN1187735C (zh) 2000-01-11 2005-02-02 松下电器产业株式会社 多模式话音编码装置和解码装置
US6757395B1 (en) 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
US6704711B2 (en) 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6732070B1 (en) * 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
JP3681105B2 (ja) 2000-02-24 2005-08-10 アルパイン株式会社 データ処理方式
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
US6523003B1 (en) * 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
US6757654B1 (en) 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
US7330814B2 (en) 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
DE60118627T2 (de) * 2000-05-22 2007-01-11 Texas Instruments Inc., Dallas Vorrichtung und Verfahren zur Breitbandcodierung von Sprachsignalen
US7136810B2 (en) 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
JP2002055699A (ja) * 2000-08-10 2002-02-20 Mitsubishi Electric Corp 音声符号化装置および音声符号化方法
BR0107142A (pt) 2000-08-25 2002-07-02 Koninkl Philips Electronics Nv Métodos para redução do número de bits de um sinal de entrada digital, e para recuperar um sinal de saìda de um sinal de comprimento de palavra reduzido, e, aparelhos de processamento de sinal, e para decodificação de sinal
US6515889B1 (en) * 2000-08-31 2003-02-04 Micron Technology, Inc. Junction-isolated depletion mode ferroelectric memory
US7386444B2 (en) 2000-09-22 2008-06-10 Texas Instruments Incorporated Hybrid speech coding and system
US6947888B1 (en) 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
JP2002202799A (ja) 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
JP3558031B2 (ja) 2000-11-06 2004-08-25 日本電気株式会社 音声復号化装置
US7346499B2 (en) 2000-11-09 2008-03-18 Koninklijke Philips Electronics N.V. Wideband extension of telephone speech for higher perceptual quality
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
AU2002218501A1 (en) * 2000-11-30 2002-06-11 Matsushita Electric Industrial Co., Ltd. Vector quantizing device for lpc parameters
GB0031461D0 (en) 2000-12-22 2001-02-07 Thales Defence Ltd Communication sets
US20040204935A1 (en) 2001-02-21 2004-10-14 Krishnasamy Anandakumar Adaptive voice playout in VOP
JP2002268698A (ja) 2001-03-08 2002-09-20 Nec Corp 音声認識装置と標準パターン作成装置及び方法並びにプログラム
US20030028386A1 (en) 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
CN1529882A (zh) * 2001-05-11 2004-09-15 西门子公司 用于扩展窄带滤波的语音信号、特别是由通信设备发送的语音信号的带宽的方法
CN1235192C (zh) * 2001-06-28 2006-01-04 皇家菲利浦电子有限公司 传输系统以及用于接收窄带音频信号的接收机和方法
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
JP2003036097A (ja) * 2001-07-25 2003-02-07 Sony Corp 情報検出装置及び方法、並びに情報検索装置及び方法
TW525147B (en) 2001-09-28 2003-03-21 Inventec Besta Co Ltd Method of obtaining and decoding basic cycle of voice
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
TW526468B (en) 2001-10-19 2003-04-01 Chunghwa Telecom Co Ltd System and method for eliminating background noise of voice signal
JP4245288B2 (ja) * 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US6751587B2 (en) 2002-01-04 2004-06-15 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
JP4290917B2 (ja) * 2002-02-08 2009-07-08 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法、及び、符号化方法
JP3826813B2 (ja) 2002-02-18 2006-09-27 ソニー株式会社 ディジタル信号処理装置及びディジタル信号処理方法
DE60303689T2 (de) 2002-09-19 2006-10-19 Matsushita Electric Industrial Co., Ltd., Kadoma Audiodecodierungsvorrichtung und -verfahren
JP3756864B2 (ja) 2002-09-30 2006-03-15 株式会社東芝 音声合成方法と装置及び音声合成プログラム
KR100841096B1 (ko) 2002-10-14 2008-06-25 리얼네트웍스아시아퍼시픽 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
US20040098255A1 (en) 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
US7242763B2 (en) * 2002-11-26 2007-07-10 Lucent Technologies Inc. Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems
CA2415105A1 (en) 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
KR100480341B1 (ko) 2003-03-13 2005-03-31 한국전자통신연구원 광대역 저전송률 음성 신호의 부호화기
DE602004007786T2 (de) 2003-05-01 2008-04-30 Nokia Corp. Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate
WO2005004113A1 (ja) 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
FI118550B (fi) * 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7428490B2 (en) * 2003-09-30 2008-09-23 Intel Corporation Method for spectral subtraction in speech enhancement
US7689579B2 (en) * 2003-12-03 2010-03-30 Siemens Aktiengesellschaft Tag modeling within a decision, support, and reporting environment
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
CA2454296A1 (en) 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
JP4259401B2 (ja) 2004-06-02 2009-04-30 カシオ計算機株式会社 音声処理装置及び音声符号化方法
US8000967B2 (en) 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
UA94041C2 (ru) * 2005-04-01 2011-04-11 Квелкомм Инкорпорейтед Способ и устройство для фильтрации, устраняющей разреженность
WO2006107833A1 (en) 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for vector quantizing of a spectral envelope representation
US9043214B2 (en) 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
EP1300833A2 (en) * 2001-10-04 2003-04-09 AT&T Corp. A method of bandwidth extension for narrow-band speech
WO2003044777A1 (en) * 2001-11-23 2003-05-30 Koninklijke Philips Electronics N.V. Audio signal bandwidth extension

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012529068A (ja) * 2009-06-01 2012-11-15 華為技術有限公司 圧縮符号化および復号の方法、符号器、復号器、ならびに符号化装置
JP2013511742A (ja) * 2009-11-19 2013-04-04 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 改良された励起信号帯域幅拡張
US9805735B2 (en) 2010-04-16 2017-10-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension
JP2013525833A (ja) * 2010-04-16 2013-06-20 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. ガイドされた帯域幅拡張およびブラインド帯域幅拡張を用いて広帯域信号を生成するため装置、方法およびコンピュータプログラム
JP2012027255A (ja) * 2010-07-23 2012-02-09 Oki Electric Ind Co Ltd 帯域拡張装置及びプログラム、並びに、音声通信装置
KR101484426B1 (ko) 2010-10-15 2015-01-19 모토로라 모빌리티 엘엘씨 Celp 기반 음성 코더에서의 오디오 신호 대역폭 확장
JP2016507783A (ja) * 2013-02-08 2016-03-10 クゥアルコム・インコーポレイテッドQualcomm Incorporated ノイズ変調とゲイン調整とを実行するシステムおよび方法
JP2018109770A (ja) * 2013-02-08 2018-07-12 クゥアルコム・インコーポレイテッドQualcomm Incorporated ノイズ変調とゲイン調整とを実行するシステムおよび方法
JP2016532886A (ja) * 2013-10-11 2016-10-20 クゥアルコム・インコーポレイテッドQualcomm Incorporated ハイバンド励振信号を生成するための混合係数の推定
US10410652B2 (en) 2013-10-11 2019-09-10 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
JP2016532912A (ja) * 2013-10-14 2016-10-20 クゥアルコム・インコーポレイテッドQualcomm Incorporated スケーリングされた高帯域励磁を使用する音声信号の帯域幅拡張のための方法、装置、デバイス、コンピュータ可読媒体
JP2017201404A (ja) * 2014-03-31 2017-11-09 クゥアルコム・インコーポレイテッドQualcomm Incorporated 複数のサブバンドを使用するハイバンド信号コーディング
JP2017515143A (ja) * 2014-03-31 2017-06-08 クゥアルコム・インコーポレイテッドQualcomm Incorporated 複数のサブバンドを使用するハイバンド信号コーディング
JP2017523461A (ja) * 2014-06-26 2017-08-17 クゥアルコム・インコーポレイテッドQualcomm Incorporated 不一致周波数範囲を使用するハイバンド信号コーディング

Also Published As

Publication number Publication date
RU2386179C2 (ru) 2010-04-10
BRPI0607690A2 (pt) 2009-09-22
ATE492016T1 (de) 2011-01-15
US8484036B2 (en) 2013-07-09
TW200703240A (en) 2007-01-16
DE602006017673D1 (de) 2010-12-02
RU2413191C2 (ru) 2011-02-27
AU2006232358A1 (en) 2006-10-12
MX2007012191A (es) 2007-12-11
TWI330828B (en) 2010-09-21
NO20075503L (no) 2007-12-28
BRPI0607646B1 (pt) 2021-05-25
IL186404A0 (en) 2008-01-20
CA2602804A1 (en) 2006-10-12
US20060277038A1 (en) 2006-12-07
WO2006107839A2 (en) 2006-10-12
KR20070118168A (ko) 2007-12-13
EP1864101A1 (en) 2007-12-12
EP1869673B1 (en) 2010-09-22
ES2391292T3 (es) 2012-11-23
EP1869670A1 (en) 2007-12-26
AU2006232363B2 (en) 2011-01-27
CA2603229A1 (en) 2006-10-12
RU2007140394A (ru) 2009-05-10
BRPI0608305B1 (pt) 2019-08-06
RU2007140383A (ru) 2009-05-10
NO20075511L (no) 2007-12-27
JP2008535026A (ja) 2008-08-28
US8140324B2 (en) 2012-03-20
KR20070118174A (ko) 2007-12-13
JP2008537165A (ja) 2008-09-11
BRPI0608269B8 (pt) 2019-09-03
CN102411935A (zh) 2012-04-11
SG161224A1 (en) 2010-05-27
NZ562182A (en) 2010-03-26
EP1864283A1 (en) 2007-12-12
AU2006232357B2 (en) 2010-07-01
RU2007140429A (ru) 2009-05-20
TW200705390A (en) 2007-02-01
KR100956876B1 (ko) 2010-05-11
KR20070118175A (ko) 2007-12-13
CA2603231C (en) 2012-11-06
IL186438A (en) 2011-09-27
RU2007140406A (ru) 2009-05-10
BRPI0607646A2 (pt) 2009-09-22
EP1869673A1 (en) 2007-12-26
KR20070118170A (ko) 2007-12-13
TWI316225B (en) 2009-10-21
CA2603255C (en) 2015-06-23
TW200705387A (en) 2007-02-01
KR100956624B1 (ko) 2010-05-11
NO20075513L (no) 2007-12-28
NZ562188A (en) 2010-05-28
EP1864282B1 (en) 2017-05-17
MX2007012184A (es) 2007-12-11
US20070088542A1 (en) 2007-04-19
BRPI0607691A2 (pt) 2009-09-22
BRPI0608269B1 (pt) 2019-07-30
RU2491659C2 (ru) 2013-08-27
NO340566B1 (no) 2017-05-15
MX2007012185A (es) 2007-12-11
KR20070118172A (ko) 2007-12-13
CA2603229C (en) 2012-07-31
PL1864101T3 (pl) 2012-11-30
RU2376657C2 (ru) 2009-12-20
WO2006107834A1 (en) 2006-10-12
IL186405A (en) 2013-07-31
AU2006232361B2 (en) 2010-12-23
NZ562183A (en) 2010-09-30
PL1864282T3 (pl) 2017-10-31
ATE485582T1 (de) 2010-11-15
AU2006232360B2 (en) 2010-04-29
BRPI0609530A2 (pt) 2010-04-13
KR100956524B1 (ko) 2010-05-07
IL186439A0 (en) 2008-01-20
US8078474B2 (en) 2011-12-13
JP5129117B2 (ja) 2013-01-23
US8332228B2 (en) 2012-12-11
IL186443A (en) 2012-09-24
KR100956523B1 (ko) 2010-05-07
IL186438A0 (en) 2008-01-20
EP1866914A1 (en) 2007-12-19
AU2006232357C1 (en) 2010-11-25
CA2603187C (en) 2012-05-08
JP2008536169A (ja) 2008-09-04
US8364494B2 (en) 2013-01-29
WO2006107839A3 (en) 2007-04-05
US8069040B2 (en) 2011-11-29
IL186442A (en) 2012-06-28
BRPI0608269A2 (pt) 2009-12-08
KR101019940B1 (ko) 2011-03-09
EP1866915B1 (en) 2010-12-15
AU2006232364B2 (en) 2010-11-25
RU2009131435A (ru) 2011-02-27
KR20070119722A (ko) 2007-12-20
US20060282263A1 (en) 2006-12-14
KR20070118173A (ko) 2007-12-13
AU2006232362B2 (en) 2009-10-08
BRPI0608305A2 (pt) 2009-10-06
KR100956525B1 (ko) 2010-05-07
JP2008535025A (ja) 2008-08-28
TW200703237A (en) 2007-01-16
IL186436A0 (en) 2008-01-20
SG161223A1 (en) 2010-05-27
HK1114901A1 (en) 2008-11-14
KR20070118167A (ko) 2007-12-13
NZ562186A (en) 2010-03-26
RU2381572C2 (ru) 2010-02-10
US20060271356A1 (en) 2006-11-30
NO20075514L (no) 2007-12-28
ES2340608T3 (es) 2010-06-07
MX2007012181A (es) 2007-12-11
US20070088541A1 (en) 2007-04-19
WO2006130221A1 (en) 2006-12-07
JP2008537606A (ja) 2008-09-18
CA2603219A1 (en) 2006-10-12
EP1864281A1 (en) 2007-12-12
BRPI0607691B1 (pt) 2019-08-13
EP1864283B1 (en) 2013-02-13
IL186404A (en) 2011-04-28
US20070088558A1 (en) 2007-04-19
EP1869670B1 (en) 2010-10-20
EP1866914B1 (en) 2010-03-03
CA2602806A1 (en) 2006-10-12
PT1864282T (pt) 2017-08-10
WO2006107833A1 (en) 2006-10-12
JP5203929B2 (ja) 2013-06-05
TW200707408A (en) 2007-02-16
TWI321777B (en) 2010-03-11
NZ562185A (en) 2010-06-25
HK1115023A1 (en) 2008-11-14
BRPI0609530B1 (pt) 2019-10-29
AU2006232361A1 (en) 2006-10-12
NO340428B1 (no) 2017-04-18
AU2006232357A1 (en) 2006-10-12
NO20075515L (no) 2007-12-28
RU2007140426A (ru) 2009-05-10
TWI321315B (en) 2010-03-01
RU2007140365A (ru) 2009-05-10
RU2390856C2 (ru) 2010-05-27
BRPI0608306A2 (pt) 2009-12-08
IL186441A0 (en) 2008-01-20
PL1866915T3 (pl) 2011-05-31
ATE482449T1 (de) 2010-10-15
US8244526B2 (en) 2012-08-14
JP2008536170A (ja) 2008-09-04
AU2006232358B2 (en) 2010-11-25
SG163556A1 (en) 2010-08-30
SG163555A1 (en) 2010-08-30
BRPI0607690A8 (pt) 2017-07-11
JP5129116B2 (ja) 2013-01-23
SI1864282T1 (sl) 2017-09-29
TW200707405A (en) 2007-02-16
CA2602806C (en) 2011-05-31
JP5161069B2 (ja) 2013-03-13
RU2402827C2 (ru) 2010-10-27
AU2006232362A1 (en) 2006-10-12
EP1864101B1 (en) 2012-08-08
CA2603187A1 (en) 2006-12-07
WO2006107836A1 (en) 2006-10-12
BRPI0608270A2 (pt) 2009-10-06
NZ562190A (en) 2010-06-25
MX2007012189A (es) 2007-12-11
PL1869673T3 (pl) 2011-03-31
JP5203930B2 (ja) 2013-06-05
HK1115024A1 (en) 2008-11-14
AU2006232363A1 (en) 2006-10-12
EP1866915A2 (en) 2007-12-19
US20080126086A1 (en) 2008-05-29
RU2007140381A (ru) 2009-05-10
WO2006107840A1 (en) 2006-10-12
AU2006252957B2 (en) 2011-01-20
TW200705389A (en) 2007-02-01
MX2007012183A (es) 2007-12-11
CN102411935B (zh) 2014-05-07
RU2402826C2 (ru) 2010-10-27
MX2007012182A (es) 2007-12-10
IL186442A0 (en) 2008-01-20
CA2603231A1 (en) 2006-10-12
CA2603255A1 (en) 2006-10-12
DE602006017050D1 (de) 2010-11-04
IL186443A0 (en) 2008-01-20
MX2007012187A (es) 2007-12-11
IL186405A0 (en) 2008-01-20
KR100982638B1 (ko) 2010-09-15
NO20075510L (no) 2007-12-28
NO20075512L (no) 2007-12-28
ATE459958T1 (de) 2010-03-15
JP5129115B2 (ja) 2013-01-23
WO2006107837A1 (en) 2006-10-12
RU2387025C2 (ru) 2010-04-20
HK1113848A1 (en) 2008-10-17
CA2603246C (en) 2012-07-17
RU2007140382A (ru) 2009-05-10
DE602006018884D1 (de) 2011-01-27
CA2603246A1 (en) 2006-10-12
EP1864282A1 (en) 2007-12-12
TWI324335B (en) 2010-05-01
DE602006012637D1 (de) 2010-04-15
CA2603219C (en) 2011-10-11
TWI320923B (en) 2010-02-21
TWI321314B (en) 2010-03-01
NO340434B1 (no) 2017-04-24
US20060277042A1 (en) 2006-12-07
DK1864282T3 (en) 2017-08-21
PT1864101E (pt) 2012-10-09
AU2006252957A1 (en) 2006-12-07
CA2602804C (en) 2013-12-24
KR100956877B1 (ko) 2010-05-11
AU2006232360A1 (en) 2006-10-12
WO2006107838A1 (en) 2006-10-12
DK1864101T3 (da) 2012-10-08
HK1169509A1 (en) 2013-01-25
JP2008535024A (ja) 2008-08-28
JP4955649B2 (ja) 2012-06-20
TWI319565B (en) 2010-01-11
JP5129118B2 (ja) 2013-01-23
TW200705388A (en) 2007-02-01
AU2006232364A1 (en) 2006-10-12
ES2636443T3 (es) 2017-10-05
US8260611B2 (en) 2012-09-04

Similar Documents

Publication Publication Date Title
JP4955649B2 (ja) 高帯域励振生成のためのシステム、方法、及び装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110614

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120315

R150 Certificate of patent or registration of utility model

Ref document number: 4955649

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150323

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250