JP4842538B2 - 合成発話の周波数選択的ピッチ強調方法およびデバイス - Google Patents

合成発話の周波数選択的ピッチ強調方法およびデバイス Download PDF

Info

Publication number
JP4842538B2
JP4842538B2 JP2004509925A JP2004509925A JP4842538B2 JP 4842538 B2 JP4842538 B2 JP 4842538B2 JP 2004509925 A JP2004509925 A JP 2004509925A JP 2004509925 A JP2004509925 A JP 2004509925A JP 4842538 B2 JP4842538 B2 JP 4842538B2
Authority
JP
Japan
Prior art keywords
signal
post
speech signal
pitch
decoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004509925A
Other languages
English (en)
Other versions
JP2005528647A (ja
Inventor
ブルーノ・ベセット
クロ−ド・ラフラーム
ミラン・ジェリネク
ロック・ルフブル
Original Assignee
ヴォイスエイジ・コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=29589086&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP4842538(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by ヴォイスエイジ・コーポレーション filed Critical ヴォイスエイジ・コーポレーション
Publication of JP2005528647A publication Critical patent/JP2005528647A/ja
Application granted granted Critical
Publication of JP4842538B2 publication Critical patent/JP4842538B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Description

本発明は、復号音声信号(decoded sound signal)の知覚音質向上の観点に立った、復号音声信号用後処理の方法および装置に関するものである。
これらの後処理の方法およびデバイスは、特に、ただし排他的ではなく、(音声を含む)音声信号のデジタル符号化に適用することができる。例えば、これらの後処理の方法およびデバイスは、雑音源が必ずしも符号化または量子化に関係したものではなく、あらゆる媒体またはシステムからのものである、より一般的な場合の信号強調にも適用することができる。
発話符号器
発話符号器は、発話信号を効率よく送信、および/または、格納するために、デジタル通信システムにおいて広く使用されている。デジタルシステムにおいて、アナログ入力発話信号は、まず、適正なサンプリングレートでサンプリングされ、連続した発話サンプルは、デジタル領域でさらに処理される。特に、発話符号器は、発話サンプルを入力として受信し、チャネルを介して送信される、または適切な格納手段に格納されることになる圧縮された出力ビットストリームを生成する。受信機では、発話復号器が、ビットストリームを入力として受信し、再構成された出力発話信号を生成する。
有用であるためには、発話符号器は、デジタルの、サンプル化入力発話信号のビットレートよりも低いビットレートを有する圧縮ビットストリームを生成しなければならない。現況技術の発話符号器は、一般的に、少なくとも16対1の圧縮レートを達成し、さらに高品質発話の復号を可能にする。これら現況技術の発話符号器の多くは、アルゴリズムに依存して様々な変形を有するCELP(符号励振線形予測)モデルに基づく。
CELP符号化において、デジタル発話信号は、フレームと呼ばれる、連続した発話サンプルのブロックの形態で処理される。各フレームに対して、符号器は、デジタルで符号化され、次に送信、および/または、格納されるいくつかのパラメータをデジタル発話サンプルから抽出する。復号器は、受信したパラメータを処理し、所与の発話信号のフレームを再構成または合成する。一般的に、デジタル発話サンプルから以下のパラメータが、CELP符号器によって抽出される。
−線スペクトル周波数(LSF)またはイミッタンススペクトル周波数(ISF)などの、変換された領域内で送信される線形予測係数(LP係数)
−ピッチ遅延(またはラグ)およびピッチ利得を含むピッチパラメータ
−革新的励振パラメータ(固定されたコードブックの指数および利得)
ピッチパラメータおよび革新的励振パラメータは、共に励振信号とは何かを説明する。この励振信号は、LP係数によって説明される線形予測(LP)フィルタへ、入力として供給される。LPフィルタは声道のモデルとみなすことができ、一方、励振信号は声門の出力とみなすことができる。LPまたはLSF係数は、通常、フレーム毎に算出および送信され、一方、ピッチパラメータおよび革新的励振パラメータは、1フレームにつき数回算出および送信される。より具体的には、各フレームは、サブフレームと呼ばれるいくつかの信号ブロックに分割され、ピッチパラメータおよび革新的励振パラメータは、サブフレーム毎に算出および送信される。フレームは、通常、10〜30ミリセカンドの期間を有し、一方、サブフレームは、通常、5ミリセカンドの期間を有する。
いくつかの発話エンコーダは、代数CELP(ACELP)モデルに基づき、より正確には、ACELPアルゴリズムに基づいている。ACELPの主要な特徴の1つとして、各サブフレーム毎に革新的励振を符号化するために代数符号帳を使用することが挙げられる。代数符号帳は、サブフレームをインターリーブされたパルス位置を有する1組のトラックに分割する。1トラックあたり数個の非零振幅(non-zero-amplitude)パルスしか許容されず、各非零振幅パルスは、対応するトラックの位置に限定される。符号器は、高速検索アルゴリズムを使用して、各サブフレームのパルス用の最適パルス位置および振幅を見出す。ACELPアルゴリズムに関しては、参照のために本明細書に組み込まれ、ITU-T G.729 CS-ACELP 8kbit/s狭帯域発話符号化アルゴリズムを記述したR. SALAMIらの記事, "Design and description of CS-ACELP. a toll quality 8kb/s speech coder", IEEE Trans. on Speech and Audio Proc., Vol. 6, No. 2, pp. 916-130, 1998年3月に記載されている。当該標準に依存した、ACELP革新的符合帳検索のいくつかの変形があることに留意されたい。本発明は、復号(合成された)発話信号の後処理に適用されるのみであるので、これらの変形には依存しない。
ACELPアルゴリズムに基づく最近の標準は、ETSI/3GPP AMR-WB 発話符号化アルゴリズムであり、ITU-T(ITU(International Telecommunication Union)の通信標準部門)によっても、勧告G.722.2[ITU-T勧告G.722.2 "Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)", Geneva, 2002年], [3GPP TS 26.190, "AMR Wideband Speech Codec: Transcoding Functions," 3GPP Technical Specification]として採用されている。AMR-WBは、6.6〜23.85kbit/sの9つの異なったビットレートで動作させるように意図されたマルチレートアルゴリズムである。当業者ならば、復号発話の音質は、通常ビットレートの増大に伴って高くなることを知っている。AMR-WBは、移動体通信システムが、チャネル条件が悪い場合に発話符号器のビットレートを下げることを可能にするように設計されてきた。ビットは、チャネル符号化ビットに変換されて送信ビットの保護を強化する。このようにして、送信ビットの全体の音質は、発話符号器が固定の単一ビットレートで動作する場合よりも高く維持することができる。
図7は、AMR-WB復号器の原理を示す概略構成図である。より具体的には、図7は、受信されたビットストリームは、最大6.4kHz(12.8kHzのサンプリング周波数)までの発話信号を符号化し、6.4kHzを越す周波数は、低帯域パラメータを使用して復号器で合成されることを強調した、復号器の高レベルの表現である。このことは、符号器において、16kHzでサンプリングされた、元の広帯域発話信号は、まず、当業者周知のマルチレート変換技術を使用して12.8kHzのサンプリング周波数にダウンサンプリングされたことを意味する。図7のパラメータ復号器701および発話復号器702は、図1のパラメータ復号器106および音源復号器107と類似である。受信されたビットストリーム709は、まず、パラメータ復号器701によって復号され、発話復号器702に供給されるパラメータ710を回復して発話信号を再合成する。特定のAMR-WB復号器の場合において、これらのパラメータは、以下のようになる。
−20ミリセカンドの各フレーム用ISF係数
−整数ピッチ遅延T0、T0近傍の分数ピッチ値T0_frac、および5ミリセカンドの各サブフレーム用ピッチ利得
−5ミリセカンドの各サブフレーム用代数符合帳の形状(パルス位置および標識)および利得
発話復号器702は、パラメータ710から、6.4kHz以下の周波数の発話信号の所与のフレームを合成し、それによって、12.8kHzのサンプリング周波数における低帯域合成発話信号712を生成するように意図されている。16kHzのサンプリング周波数に対応する全帯域を回復するために、AMR-WB復号器は、パラメータ復号器701からの復号されたパラメータ710に応答して、サンプリング周波数16kHzにおける高帯域信号711を再合成する高帯域再合成処理器707を含む。高帯域信号再合成処理器707の詳細は、参照により本明細書に組み込まれた以下の出版物に開示されている。
−ITU-T勧告G.722.2 "Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)", Geneva, 2002年
−3GPP TS 26.190, "AMR Wideband Speech Codec: Transcoding Functions," 3GPP Technical Specification
図7の高帯域信号711と称される、高帯域再合成処理器707の出力は、6.4kHzよりも高いところにエネルギーが集中した、16kHzのサンプリング周波数における信号である。処理器708は、高帯域信号711を16kHzにアップサンプリングされた低帯域発話信号713に加算し、16kHzのサンプリング周波数におけるAMR-WB復号器の完全な復号発話信号714を形成する。
後処理の必要性
発話符号器が通信システム中で使用されるときはいつも、合成または復号された信号は、伝送誤りが無い場合ですら、決して元の発話信号と同一ではない。圧縮比が高くなればなるほど、符号器によって引き起こされる歪は、大きくなる。この歪は、異なった手法を使用して、主観的に小さくすることができる。第一の手法は、符号器においてより良く記述するために信号を条件付ける、または発話信号中の主観的に相関のある情報を符号化することである。しばしばW(z)として表現される、フォルマント重み付けフィルタ(formant weighting filter)の使用は、広く使用されたこの第一の手法の例である[B. KleijnおよびK. Paliwal編, <<Speech Coding and Synthesis,>> Elsevier, 1995年]。このフィルタW(z)は、一般的に、適応可能に構成され、フォルマントスペクトル近傍の信号エネルギーを減じて、低エネルギー帯域の相関エネルギーを増大させるように演算される。符号器は、低エネルギー帯域をより良く量子化する。この低エネルギー帯域は、さもなければ、符号化雑音によってマスキングされ、知覚される歪を増大させる。符号器における信号条件付けの別の例は、符号器において励振信号の高調波構造を強調する、いわゆるピッチ先鋭化フィルタ(pitch sharpening filter)である。ピッチ先鋭化の目的は、次数間高調波雑音レベルが、知覚感覚内で十分低く維持されることを確保することである。
発話符号器によって引き起こされる知覚される歪を最小化するための第二の手法は、いわゆる後処理アルゴリズムの応用である。図1に示すように、後処理は、復号器において適用される。図1において、発話符号器101および発話復号器105は、2つのモジュールに分割される。発話符号器101の場合、音源符号器102は、送信または格納されることになる一連の発話符号化パラメータ109を生成する。これらのパラメータ109は、発話符号化アルゴリズムおよび符号化すべきパラメータに依存して、特定の符号化方法を使用して、パラメータ符号器103によって2進符号化される。符号化発話信号(2進符号化パラメータ)110は、次に、通信チャネル104を介して復号器へ送信される。復号器において、受信ビットストリーム111が、まず、パラメータ復号器106によって解析され、受信された、符号化された音声信号符号化パラメータが復号され、復号されたパラメータは音源復号器107によって使用され、合成発話信号112が生成される。後処理(図1の後処理器108参照)の目的は、合成発話信号中の知覚的に相関のある情報を強調、あるいは知覚的に煩わしい情報を等価的に減少または除去することである。広く使用される後処理の2つの形態は、フォルマント後処理およびピッチ後処理である。最初のケースでは、合成発話信号のフォルマント構造は、発話フォルマントに相関した周波数応答を有する適応型フィルタを使用して増幅される。合成発話信号のスペクトルの峰は、スペクトルの谷を犠牲にして強調され、スペクトルの谷の相関エネルギーは、小さくなる。ピッチ後処理の場合、適応型フィルタは、合成発話信号にも適用される。しかしこの場合、フィルタの周波数応答は、精細なペクトル構造、即ち、高調波と相関している。ピッチ後処理フィルタは、次数間高調波エネルギーを犠牲にして高調波を強調し、次数間高調波エネルギーは、相当小さくなる。ピッチ後処理フィルタの周波数応答は、通常、全周波数範囲に亘ることに留意されたい。その影響は、復号発話中に高調波構造が現れない周波数帯域内ですら、後処理された発話上に高調波構造が重畳されることである。これは、全周波数帯域上で、周期的構造をめったに示さない広帯域発話(16kHzでサンプリングされる発話)にとって、知覚的に最適な手法ではない。
R. SALAMIらの記事, "Design and description of CS-ACELP. a toll quality 8kb/s speech coder", IEEE Trans. on Speech and Audio Proc., Vol. 6, No. 2, pp. 916-130, 1998年3月 ITU-T勧告G.722.2 "Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)", Geneva, 2002年 3GPP TS 26.190, "AMR Wideband Speech Codec: Transcoding Functions," 3GPP Technical Specification B. KleijnおよびK. Paliwal編, <<Speech Coding and Synthesis,>> Elsevier, 1995年
本発明は、復号音声信号の知覚音質向上に鑑みて、復号音声信号を後処理するための方法に関するものであり、復号音声信号を複数の周波数サブ帯域信号に分割するステップと、全ての周波数サブ帯域信号に対してではなく、周波数サブ帯域信号の中の少なくとも1つに後処理を施すステップとを含む。
本発明は、復号音声信号の知覚音質向上に鑑みて、復号音声信号を後処理するためのデバイスに関するものであり、復号音声信号を複数の周波数サブ帯域信号に分割するための手段と、全ての周波数サブ帯域信号に対してではなく、周波数サブ帯域信号の中の少なくとも1つに後処理を施すための手段とを含む。
例示的な実施形態によると、上記少なくとも1つの周波数サブ帯域信号の後処理の後、周波数サブ帯域信号は加算され、後処理された復号音声信号出力を生成する。
したがって、後処理用の方法およびデバイスは、所望のサブ帯域(群)の中で後処理を限定して実施し、その他のサブ帯域群は実質的に変更しないでおくことができる。
本発明はさらに、音声信号復号器に関するものであり、符号化音声信号を受け取るための入力と、音声信号符号化パラメータ復号用の符号化音声信号が供給されるパラメータ復号器と、復号音声信号生成用の復号された音声信号符号化パラメータが供給される音声信号復号器と、復号音声信号の知覚音質向上に鑑みて、復号音声信号を後処理するための上記のような後処置デバイスとを含む。
本発明の上記および他の目的、ならびに利点および特徴は、添付図面を参照してほんの一例として呈示された例示的な実施形態の以下の非限定的説明を読むことによってより明白になるであろう。
図2は、本発明の例示的な実施形態の一般原理を示す概略構成図である。
図1において、入力信号(後処理が適用される信号)は、通信システムの受信機における発話復号器105(図1)によって生成された復号(合成)発話信号112である(図1の音源復号器107の出力)。目的は、図1の後処理器108の出力113(図2の処理器203の出力でもある)に、知覚音質の向上した、後処理された復号発話信号を生成することである。この目的は、まずは少なくとも1度、そしておそらくは2度以上、適応型フィルタリング動作を入力信号112(適応型フィルタ201a、201b、…、201N参照)に適用することによって達成される。これらの適応型フィルタは、以下の記述の中で説明される。適応型フィルタ201aから201Nの中のいくつかは、例えば、入力に等しい出力を有するなど、必要なときはいつでも平凡な機能になりうることを指摘しておきたい。各適応型フィルタ201a、201b、…、201Nの出力204a、204b、…、204Nは、それぞれサブ帯域フィルタ202a、202b、…、202Nを用いて帯域通過濾波され、サブ帯域フィルタ202a、202b、…、202Nそれぞれの、濾波された後の出力205a、205b、…、205Nを、処理器203を用いて加算することによって、後処理された復号発話信号113が得られる。
1つの例示的な実施形態において、二帯域分解が用いられ、適応型フィルタリングは、低帯域にのみ適用される。これは、合成発話信号の一次高調波近傍の周波数にほぼターゲットを絞った全体後処理をもたらす。
図3は、図2の例示的な実施形態の特殊な形態を構成する二帯域ピッチ強調器の概略構成図である。より具体的には、図3は、二帯域後処理器(図1の後処理器108参照)の基本機能を示す。この例示的な実施形態によると、他のタイプの後処理も考えられるであろうが、ピッチ強調のみが後処理とみなされる。図3において復号発話信号(図1の音源復号器107の出力112と仮定する)は、1対のサブブランチ308および309を介して供給される。
上側ブランチ(higher branch)308において、復号発話信号112は、高域通過フィルタ301によって濾波され、高帯域信号310(sH)を生成する。この特定の実施例では、上側ブランチ内において適応型フィルタは、使用されない。下側ブランチ(lower branch)309において、復号発話信号112は、まず、任意選択の低域通過フィルタ302、ピッチトラッキングモジュール(pitch tracking module)303、およびピッチ強調器304を含む適応型フィルタ307を用いて処理され、次に、低域通過フィルタ305を用いて濾波され、低帯域の後処理された信号311(sLEF)が得られる。後処理された復号発話信号113は、低域通過フィルタ305および高域通過フィルタ301それぞれの出力からの低帯域の後処理された信号311および高帯域の後処理された信号312を、加算器306を用いて加算することによって得られる。低域通過フィルタ305および高域通過フィルタ301としては、例えば、無限インパルス応答(UR)または有限インパルス応答(FIR)型など様々なタイプを挙げることができることを指摘すべきであろう。この例示的な実施形態においては、線形位相FIRフィルタが使用される。
したがって、図3の適応型フィルタ307は、2つ、そしておそらくは3つの処理器、低域通過フィルタ305に類似した任意選択の低域通過フィルタ302、ピッチトラッキングモジュール303、およびピッチ強調器304から構成される。
低域通過フィルタ302は、割愛してもよいが、図3の後処理を、各サブ帯域における特定の濾波が後に続く、二帯域の分解としてみることができるように含められる。低帯域中の復号発話信号112の低域通過濾波(フィルタ302)後、結果としての信号sLは、ピッチ強調器304を用いて処理される。ピッチ強調器304の目的は、復号発話信号中の次数間高調波を減少させることである。本例示的な実施形態において、ピッチ強調器304は、以下の式で説明される時間依存性の線形フィルタによって達成される。
Figure 0004842538
ここで、αは次数間高調波の減衰を制御する係数、Tは入力信号x[n]のピッチ期間、y[n]はピッチ強調器の出力信号である。フィルタタップ(filter taps)n-Tおよびn+Tにおける遅延が異なる(例えば、n-T1およびn+T2)、より一般的な式を使用することも可能であろう。パラメータTおよびαは、時間と共に変化し、ピッチトラッキングモジュール303によって与えられる。αの値が1のとき、式(1)により説明されるフィルタの利得は、周波数1/(2T)、3/(2T)、5/(2T)など、即ち、1/T、3/T、5/Tなどの高調波周波数同士の中点において正確に0である。αの値が0に近づくと、式(1)のフィルタによって引き起こされる高調波同士間の減衰は、減少する。αの値が0のとき、フィルタの出力は、入力に等しい。図8は、Tの値が10サンプルで、ピッチ遅延を(任意に)設定したとき、αの値が0.8および1の場合の、式(1)により説明されるフィルタの周波数応答(単位dB)を示す。αの値は、いくつかの手法を使用して演算することができる。例えば、当業者周知の正規化されたピッチ相関は、係数αを制御するために使用することができる。正規化されたピッチ相関が高くなればなる程(1に近くなればなる程))、αの値は大きくなる。周期Tが10の周期的信号x[n]は、図8の周波数応答の最大値において、即ち、正規化された周波数0.2、0.4などにおいて高調波を有する。式(1)のピッチ強調器は、高調波同士間の信号エネルギーのみを減衰させ、高調波成分は、フィルタによって更新されないであろうことは、図8から容易に理解できる。図8は、パラメータαを変化させることによって、式(1)のフィルタによって可能となる次数間高調波の減衰の量を制御することができることも示している。図8に示す式(1)のフィルタの周波数応答は、スペクトルの全周波数に展開できることに留意されたい。
発話信号のピッチ周期は、時間と共に変化するので、ピッチ強調器304のピッチ値Tはそれに応じて変化する必要がある。ピッチトラッキングモジュール303は、処理すべき復号発話信号の各フレーム用の適正なピッチ値Tをピッチ強調器304に供給することを任としている。そのために、ピッチトラッキングモジュール303は、入力として、復号発話サンプルのみならず、図1のパラメータ復号器106からの復号パラメータ114をも受け取る。
典型的な発話符号器は、各発話サブフレームに対して、T0と呼ぶピッチ遅延および、場合により、端数のサンプル分解に対する適応型符合帳の寄与率を補間するために使用される端数値T0_fracを抽出するので、ピッチトラッキングモジュール303は、この復号ピッチ遅延を使用して復号器にピッチトラッキングの焦点をあわせる。可能性のある方法の1つは、符号器がすでにピッチトラッキングを行ったということを利用して、ピッチ強調器304内で直接T0およびT0_fracを使用することである。この例示的な実施形態において使用される、可能性のあるもう1つの方法は、復号ピッチ値T0の近傍値、倍数、または約数に焦点を合わせながら、復号器においてピッチトラッキングを再計算することである。ピッチトラッキングモジュール303は、次に、ピッチ遅延Tをピッチ強調器304に供給し、ピッチ強調器304は、復号発話信号の現下のフレーム用に式(1)のこのTの値を使用する。出力は、信号sLEである。
ピッチ強調信号sLEは、フィルタ305を用いて低域を濾波され、ピッチ強調信号sLEの低周波数が分離され、式(1)のピッチ強調器のフィルタが、ピッチ遅延Tに応じて、復号発話フレームの境界で時間と共に変化したときに発生する高周波数成分が除去される。これによって、低帯域の後処理された信号sLEFを生成し、次に、信号sLEFは、加算器306中で高帯域信号sHに加算される。その結果、低帯域中の次数間高調波が減少した、後処理された復号発話信号113が生成される。ピッチ強調が適用される周波数帯域は、低域通過フィルタ305のカットオフ周波数に依存する(および低域通過フィルタ302中で任意選択に適用される)。
図6aおよび6bは、図3で説明された後処理の効果を示す信号スペクトルの例である。図6aは、図1の後処理器108の入力信号112(図3中の復号発話信号112)のスペクトルである。この例示的な実施例において、入力信号は、任意に選んだ373Hzの基本周波数と、周波数f0/2、3f0/2、5f0/2における<<雑音>>成分とを伴った、20の高調波から構成される。これらの3つの雑音成分は、図6a中の低周波数高調波同士間に見られる。サンプリング周波数は、この実施例では、16kHzである。図3に示し、上記説明した二帯域ピッチ強調器は、図6aの信号に適用される。16kHzのサンプリング周波数および図6aにおけると同様373Hzに等しい基本周波数の周期的信号で、ピッチトラッキングモジュール303は、16000/373≒43サンプルの周期を算出する。これは、式(1)のピッチ強調器フィルタ用に使用された値であり、図3のピッチ強調器304に適用される。αの値0.5も使用される。低域通過フィルタ305および高域通過フィルタ301は、対称の、31タップ付線形FIRフィルタである。この実施例用のカットオフ周波数は、2000Hzとして選ばれた。これらの特定の値は、例示的実施例としてのみ与えられる。
加算器306の出力における後処理された復号発話信号113は、図6bに示すスペクトルを有する。図6a中の3つの次数間高調波正弦曲線は、完全に除去されているが、信号の高調波は、実質的に変更されていないことがわかる。ピッチ強調器の効果は、周波数的手法として、低域通過フィルタのカットオフ周波数(この実施例では2000Hz)を減少させることもわかる。したがって、低帯域のみが後処理の影響を受ける。このことは、本発明の例示的な実施形態の主要な特徴である。任意選択の低域通過フィルタ302、低域通過フィルタ305、および高域通過フィルタ301のカットオフ周波数を変化させることによって、どの周波数までピッチ強調器を適用するかを制御することができる。
AMR-WB発話復号器への応用
本発明は、発話復号器によって合成されるあらゆる発話信号、または、除去する必要のある次数間高調波によって悪化したあらゆる発話信号にも適用可能である。この節では、AMR-WB 復号発話信号に本発明を応用した具体的な実施例について示す。後処理は、図7の低帯域合成発話信号712、即ち、12.8kHzのサンプリング周波数における合成発話を生成する発話復号器702の出力に適用される。
図4は、入力信号が、サンプリング周波数12.8kHzにおけるAMR-WB低帯域合成発話信号であるときの、ピッチ後処理器の構成図を示す。より正確には、図4に示す後処理器は、処理器704、705、および706を含むアップサンプリングユニット703に取って代わる。図4のピッチ後処理器は、16kHzにアップサンプリングされた合成発話信号にも適用可能であるが、アップサンプリング前にピッチ後処理器を適用することによって復号器におけるフィルタ動作の数を減らすことができ、したがって複雑さを減らすことができる。
図4の入力信号(AMR-WB低帯域合成発話(12.8kHz))を信号sと表わす。この具体的実施例において、信号sは、サンプリング周波数12.8kHzにおけるAMR-WB低帯域合成発話信号(処理器702の出力)である。図4のピッチ後処理器は、受け取った復号パラメータ114(図1)および合成発話信号sを使用して、5ミリセカンドの各サブフレーム用のピッチ遅延Tを決定するピッチトラッキングモジュール401を含む。ピッチトラッキングモジュールによって使用される復号パラメータは、サブフレーム用整数ピッチ値T0およびサブフレーム分解能用端数ピッチ値T0_fracである。ピッチトラッキングモジュール401において算出されたピッチ遅延Tは、ピッチ強調用の次段において使用される。受信した復号ピッチパラメータT0およびT0_fracを直接使用して、ピッチフィルタ402内のピッチ強調器によって使用される遅延Tを形成することも可能である。しかし、ピッチトラッキングモジュール401は、ピッチ強調に悪影響を及ぼす可能性のあるピッチの倍数またはピッチの約数を訂正することができる。
モジュール401用ピッチトラッキングアルゴリズムの例示的な実施形態は、以下のようになる(具体的な閾値およびピッチトラッキング値は、ほんの一例として与えられる)。
−まず、復号ピッチ情報(ピッチ遅延T0)は、先行フレームの復号ピッチ遅延T_prevの格納値と比較される。T_prevは、ピッチトラッキングアルゴリズムに準じた以下のステップのいくつかによって修正されている。例えば、もしT0が1.16*T_prevよりも小さいときは、下のケース1へ行き、それ以外のとき、もしT0が1.16*T_prevよりも大きいときは、T_tempをT0に設定し、下のケース2に行く。
ケース1
まず、最後の合成サブフレームと最後の合成サブフレームの前にT0/2のサンプルにおいて始まる合成信号との間の相互相関C2(相互積)を算出する(半復号ピッチ値における相関を見る)。
次に、最後の合成サブフレームと最後の合成サブフレームの前にT0/3のサンプルにおいて始まる合成信号との間の相互相関C3(相互積)を算出する(1/3復号ピッチ値における相関を見る)。
次に、C2とC3との間の最大値を選択し、対応する、T0の約数(C2>C3のときは、T0/2、またC3>C2のときは、T0/3)における正規化された相関Cn(C2またはC3の正規化されたもの)を算出する。最も高い正規化相関に対応するピッチ約数をT_newと呼ぶ。
Cn>0.95(強い正規化相関)のときは、新ピッチ期間は、(T0ではなく)T_newとなる。ピッチトラッキングモジュール401から値T = T_newを出力する。次のサブフレームピッチトラッキング用のT_prev = Tを保存し、ピッチトラッキングモジュール401から出る。
0.7<Cn<0.95のときは、下のケース2における比較用として(上記C2またはC3に対応した)T_temp = T0/2またはT0/3を保存する。それ以外のとき、Cn<0.7のときは、T_temp = T0を保存する。
ケース2
比Tn = [T_temp/n]の可能なあらゆる値を算出する。ここで、[x]は、xの整数部分を意味し、n=1,2,3などは整数である。
ピッチ遅延約数Tnにおけるあらゆる相互相関Cnを算出する。あらゆるCnの中の最大相互相関としてのCn_maxを保持する。n>1かつCn>0.8のときは、ピッチトラッキングユニット401のピッチ周期出力TとしてTnを出力する。その他のときは、T1=T_tempを出力する。ここで、T_tempの値は、上記ケース1における算出結果に依存する。
ピッチトラッキングモジュール401の上記実施例は、例示のためにのみ呈示されることに留意されたい。復号器におけるより良いピッチトラッキングを確保するために、他のあらゆるピッチトラッキング方法またはデバイスをモジュール401(または303および502)において実施してもよい。
したがって、ピッチトラッキングモジュールの出力は、ピッチフィルタ402において使用される周期Tであり、ピッチフィルタ402は、この好ましい実施形態においては、式(1)のフィルタによって説明される。また、αの値0は、フィルタリングを行わない(ピッチフィルタ402の出力は、その入力に等しい)ことを意味し、αの値1は、最高量のピッチ強調に相当する。
強調された信号SE(図4)は、一旦判定されると、入力信号sと組み合わされ、図3に示すように、低帯域のみがピッチ強調に供給される。図4においては、図3に比較して修正された手法が使用される。図4のピッチ後処理器は、図7のアップサンプリングユニット703に取って代わるので、図3のサブ帯域フィルタ301および305は、図7の補間フィルタ705と組み合わされ、フィルタリング動作の回数、したがって、フィルタリング遅延は最小化される。より具体的には、図4のフィルタ404および407は、両方とも帯域通過フィルタ(周波数帯域を分離する)および補間フィルタ(12.8KHzから16kHzへのアップサンプリング用)として作用する。これらのフィルタ404および407は、さらに、帯域通過フィルタ407の低周波数拒絶帯域における制限が緩和される(即ち、帯域通過フィルタ407は、低周波数における信号を完全に減衰させる必要はない)ように設計することも可能である。これは、図9に示すものと類似の設計制限を用いることによって達成することが可能である。図9aは、低域通過フィルタ404の周波数応答例である。このフィルタのDC(直流)利得は、フィルタ利得が0Hzにおいて5であるべきことを意味する、5対4の補間比を有する補間フィルタとしても作用するので、5(1ではなく)であることに留意されたい。図9bは、帯域通過フィルタ407の周波数応答であり、周波数応答により、帯域通過フィルタ407は、低帯域において低域通過フィルタ404と相補的になる。この実施例において、フィルタ407は、高域通過フィルタ(フィルタ301など)および低域通過フィルタ(補間フィルタ705など)の両方として作用しなければならないので、帯域通過フィルタであって、フィルタ301などの高域通過フィルタではない。図9を再び参照して、低域通過フィルタ404および帯域通過フィルタ407は、図4のように、並行であるとみなすと、相補的であることがわかる。それらの組み合わせ周波数応答を(並行して使用されたとき)、図9cに示す。
完全を期すために、この例示的な実施形態において使用される、フィルタ404および407のフィルタ係数表が以下に与えられる。勿論、これらのフィルタ係数表は、ほんの一例として与えられる。当然のことながら、これらのフィルタは、本発明の範疇、精神、および本質を変更することなく置き換え可能である。
Figure 0004842538
Figure 0004842538
図4のピッチフィルタ402の出力をSEと呼ぶ。上側ブランチの信号と再度組み合わされるために、SEは、まず、処理器403、低域通過フィルタ404、および処理器405によってアップサンプリングされ、アップサンプリングされた上側ブランチ信号410に、加算器409を用いて加算される。上側ブランチでのアップサンプリング動作は、処理器406、帯域通過フィルタ407、および処理器408によって行われる。
提案されたピッチ強調器の代替実施
図5は、本発明の例示的な実施形態による二帯域ピッチ強調器の代替実施を示す。図5の上側ブランチは、入力信号を全然処理しないことに留意されたい。このことは、この特定のケースの場合、図2の上側ブランチ中のフィルタ(適応型フィルタ201aおよび201b)は、平凡な入出力特性(出力は入力に等しい)を有する。下側ブランチにおいて、入力信号(強調されるべき信号)はまず、任意選択の低域通過フィルタ501を用いて処理され、次に、以下の式によって定義される次数間高調波フィルタ503と呼ばれる線形フィルタを用いて処理される。
Figure 0004842538
式(1)と比較して、右辺の第二項の前にはマイナス符号があることに留意されたい。強調係数αは、式(2)に含まれず、むしろ、図5の処理器504による適応型利得によって導入されることにも留意されたい。式(2)によって説明される次数間高調波フィルタ503は、Tサンプルの周期を有する周期的信号の高調波を完全に除去したり、正確に高調波同士間の周波数における正弦曲線の振幅の変化はしないが、位相が正確に180度反転(符号反転に等しい)したりするような周波数応答を持っている。例えば、図10は、周期Tとして(任意に)10サンプルが選ばれたときの、式(2)によって説明されるフィルタの周波数応答を示す。周期Tが10サンプルの周期的信号は、正規規格化周波数0.2、0.4、0.6などにおいて高調波を呈し、図10は、Tが10サンプルである、式(2)のフィルタは、これらの高調波を完全に除去することを示す。一方、高調波同士間の、正確な中間点における周波数は、フィルタの出力に、同振幅で、ただし180度移相して現れる。これが、式(2)によって説明され、フィルタ503として使用されるフィルタが、次数間高調波フィルタと呼ばれる所以である。
次数間高調波フィルタ503において使用するためのピッチ値Tは、ピッチトラッキングモジュール502によって適応可能に得られる。ピッチトラッキングモジュール502は、図3および4に示した、上記に開示した方法と同様に、復号発話信号および復号パラメータを基にして動作する。
次数間高調波フィルタ503の出力507は、信号高調波同士間の中間点で180°位相シフトした、入力復号信号112の次数間高調波部分によって実質的に形成された信号である。次に、次数間高調波フィルタ503の出力507は、利得α倍され(処理器504)、次いで、低域通過濾波され(フィルタ505)、図5の入力復号発話信号112に適用される低周波数帯域修正が得られ、後処理された復号信号(強調された信号)509が得られる。処理器504における係数αは、ピッチ量または次数間高調波強調の量を制御する。αが1に近づけば近づくほど、強調度は高くなる。αが、0に等しいときは、強調度は得られない、即ち、加算器506の出力は、正確に入力信号(図5の復号発話)に等しくなる。αの値は、いくつかの手法を使用して演算することができる。例えば、当業者周知の正規化されたピッチ相関は、係数αを制御するために使用することができる。即ち、正規化されたピッチ相関が高くなればなるほど(1に近づくほど)、αの値は大きくなる。
最終の、後処理された復号発話信号509は、加算器506を用いて、低域通過フィルタ505の出力を入力信号(図5の復号発話信号112)に加算することによって得られる。低域通過フィルタ505のカットオフ周波数に依存して、この後処理の影響は、入力信号112の低周波数、最大で所与の周波数までに制限される。より高い周波数は、後処理の影響を事実上受けない。
適応型高域通過フィルタを使用した、一帯域代替実施例
低周波数における合成信号強調用サブ帯域後処理を実施するための最後の1つの代替実施例は、カットオフ周波数が入力信号のピッチ値に応じて変化する適応型高域通過フィルタを使用することである。具体的には、図面を参照にしないが、この例示的な実施形態を使用した低周波数強調は、以下のステップに従って、各入力信号フレームおいて実行される。
1.入力信号およびもし復号発話信号を後処理する場合おそらくは復号パラメータ(発話復号器105の出力)を使用して、入力信号ピッチ値(信号周期)を決定する。これは、モジュール303、401、および502のピッチトラッキング動作と同様の動作である。
2.カットオフ周波数は、入力信号の基本周波数よりも低いが、それに近くなるように高域通過フィルタの係数を算出する。あるいは、既知のカットオフ周波数を有する予め算出され、格納されている高域通過フィルタ同士間で補間する(補間は、フィルタタップ領域、または極・零領域、またはISF(イミッタンススペクトル周波数)領域のLSF(線スペクトル周波数)などの何らかの他の変換された領域において実施できる)。
3.入力信号フレームを算出された高域通過フィルタで濾波し、そのフレーム用の後処理された信号を得る。
本発明のこの例示的な実施形態は、図2において唯一の処理ブランチを使用するのと等価であり、また、ブランチの適応型フィルタをピッチ制御された高域通過フィルタと定義するのと等価であることを指摘すべきである。この手法で達成される後処理は、第一次高調波より低い周波数範囲に影響するのみであり、第一次高調波より高い次数間高調波エネルギーには影響しない。
本発明は、その例示的な実施形態を参照して上記に説明されたが、これらの実施形態は、本発明の精神および本質から逸脱することなく、添付の請求の範囲内で、任意選択に変更することが可能である。例えば、例示的な実施形態は、復号発話信号に関して説明したが、当業者は、本発明の概念が他のタイプの復号信号、特に、ただし排他的ではなく、他のタイプの復号音声信号に適用できることを評価するであろう。
復号器における後処理を使用する発話符号器/復号器システムの実施例の高レベル構造の概略構成図である。 入力が復号(合成)発話信号(実線)および復号パラメータ(点線)である、一揃いの適応型フィルタおよびサブ帯域フィルタを使用する本発明の例示的な実施形態の一般的な原理を示す概略構成図である。 図2の例示的な実施形態の特殊な形態を構成する二帯域ピッチ強調器の概略構成図である。 特殊な場合のAMR-WB広帯域発話復号器に応用した、本発明の例示的な実施形態の概略構成図である。 図4の例示的な実施形態の代替実施を示す概略構成図である。 前処理された信号のスペクトルの例を示すグラフである。 図3に記載された方法を使用したときに得られる後処理された信号のスペクトルの例を示すグラフである。 3GPP AMR-WB復号器の動作原理を示す概略構成図である。 ピッチ期間Tが10のサンプルである特殊な場合を有する、式(1)によって記述された、ピッチ強調器フィルタの周波数応答の例を示すグラフである。 ピッチ期間Tが10のサンプルである特殊な場合を有する、式(1)によって記述された、ピッチ強調器フィルタの周波数応答の例を示すグラフである。 図4の低域通過フィルタ404の周波数応答の例を示すグラフである。 図4の帯域通過フィルタ407の周波数応答の例を示すグラフである。 図4の低域通過フィルタ404および帯域通過フィルタ407の結合周波数応答の例を示すグラフである。 式(2)によって記述され、ピッチ期間Tが10サンプルである特殊な場合に、図5の次数間高調波フィルタ503中に使用されている次数間高調波フィルタの周波数応答の例を示すグラフである。
符号の説明
101 発話符号器
102 音源符号器
103 パラメータ符号器
104 通信チャネル
105 発話復号器
106 パラメータ復号器
107 音源復号器
108 後処理器
109 発話符号化パラメータ
110 符号化発話信号
111 受信ビットストリーム
112 合成発話信号
113 後処理された復号発話信号
114 復号パラメータ
201a〜201N 適応型フィルタ
202a〜202N サブ帯域フィルタ
203 処理器
204a〜204N 適応型フィルタの出力
205a〜205N サブ帯域フィルタの出力
301 高域通過フィルタ
302 任意選択の低域通過フィルタ
303 ピッチトラッキングモジュール
304 ピッチ強調器
305 低域通過フィルタ
306 加算器
307 適応型フィルタ
308 サブブランチ
309 サブブランチ
310 高帯域信号
311 低帯域の後処理された信号
401 ピッチトラッキングモジュール
402 ピッチフィルタ
403 処理器
404 低域通過フィルタ
405 処理器
406 処理器
407 帯域通過フィルタ
408 処理器
409 加算器
410 上側ブランチ信号
501 任意選択の低域通過フィルタ
502 ピッチトラッキングモジュール
503 次数間高調波フィルタ
504 処理器
505 低域通過フィルタ
506 加算器
507 次数間高調波フィルタの出力
509 後処理された復号発話信号
701 パラメータ復号器
702 発話復号器
703 アップサンプリングユニット
704 処理器
705 補間フィルタ
706 処理器
707 高帯域再合成処理器
708 処理器
709 受信されたビットストリーム
710 パラメータ
711 高帯域信号
712 低帯域合成発話信号
713 アップサンプリングされた低帯域発話信号
714 AMR-WB復号器の復号発話信号

Claims (58)

  1. 復号音声信号の知覚音質向上に鑑みて、前記復号音声信号を後処理する方法であって、
    前記復号音声信号を複数の周波数サブ帯域信号に分割するステップと、
    記周波数サブ帯域信号の一部のみに対して後処理を施すステップとを備えていて、
    前記周波数サブ帯域信号の一部のみに対して後処理を施すステップは、前記復号音声信号の低周波数帯域のみの周波数サブ帯域信号をピッチ強調するステップを含む
    ことを特徴とする方法。
  2. 記周波数サブ帯域信号の一部の後処理の後、前記周波数サブ帯域信号同士を加算し、後処理された復号音声信号出力を生成するステップをさらに含む請求項1に記載の後処理の方法。
  3. 前記ピッチ強調するステップは、前記周波数サブ帯域信号の一部を適応可能に濾波するステップを含む請求項1に記載の後処理の方法。
  4. 前記復号音声信号を複数の周波数サブ帯域信号に分割するステップは、前記復号音声信号をサブ帯域濾波して前記複数の周波数サブ帯域信号を生成するステップを含む請求項1に記載の後処理の方法。
  5. 前記周波数サブ帯域信号の一部に対して、
    ピッチ強調するステップは、前記復号音声信号を適応可能に濾波するステップを含み、
    前記復号音声信号を分割するステップは、前記適応可能に濾波された復号音声信号をサブ帯域濾波するステップを含む請求項1に記載の後処理の方法。
  6. 前記復号音声信号を複数の周波数サブ帯域信号に分割するステップは、
    前記復号音声信号を高域通過濾波して周波数高帯域信号を生成するステップと、
    前記復号音声信号を第1低域通過濾波して周波数低帯域信号を生成するステップとを含み、
    前記ピッチ強調するステップは、
    前記復号音声信号を第1低域通過濾波して周波数低帯域信号を生成するステップの前に前記復号音声信号をピッチ強調するステップを含む請求項1に記載の後処理の方法。
  7. 前記復号音声信号をピッチ強調する前に前記復号音声信号を第2低域通過濾波するステップをさらに含む請求項に記載の後処理の方法。
  8. 前記周波数高帯域信号と前記周波数低帯域信号とを加算し、後処理された復号音声信号出力を生成するステップをさらに含む請求項6に記載の後処理の方法。
  9. 前記復号音声信号を複数の周波数サブ帯域信号に分割するステップは、
    前記復号音声信号を帯域通過濾波して周波数高帯域信号を生成するステップと、
    前記復号音声信号を低域通過濾波して周波数低帯域信号を生成するステップとを含み、
    前記ピッチ強調するステップは、
    前記復号音声信号を低域通過濾波して周波数低帯域信号を生成するステップの前に前記復号音声信号をピッチ強調するステップを含む請求項1に記載の後処理の方法。
  10. 前記周波数高帯域信号と前記周波数低帯域信号とを加算し、後処理された復号音声信号出力を生成するステップをさらに含む請求項に記載の後処理の方法。
  11. 前記復号音声信号を複数の周波数サブ帯域信号に分割するステップは、
    前記復号音声信号を低域通過濾波して周波数低帯域信号を生成するステップを含み、
    前記ピッチ強調するステップは、
    前記周波数低帯域信号をピッチ強調するステップを含む請求項1に記載の後処理の方法。
  12. 前記ピッチ強調するステップは、前記復号音声信号の次数間高調波を減少させるために、次数間高調波フィルタを用いて前記復号音声信号を処理するステップを含む請求項11に記載の後処理の方法。
  13. 前記ピッチ強調するステップは、前記次数間高調波濾波された復号音声信号に適応型ピッチ強調利得を乗算するステップを含む請求項12に記載の後処理の方法。
  14. 前記復号音声信号を次数間高調波フィルタを用いて処理する前に前記復号音声信号を低域通過濾波するステップをさらに含む請求項12に記載の後処理の方法。
  15. 前記復号音声信号と前記周波数低帯域信号とを加算し、後処理された復号音声信号出力を生成するステップをさらに含む請求項11に記載の後処理の方法。
  16. 前記ピッチ強調するステップは、前記復号音声信号の次数間高調波を減少させるために、以下の伝達関数、
    Figure 0004842538
    を有する次数間高調波フィルタを用いて前記復号音声信号を処理するステップを含む請求項11に記載の後処理の方法。ここで、x[n]は、前記復号音声信号、y[n]は、所与のサブ帯域中の前記次数間高調波濾波された復号音声信号、Tは、前記復号音声信号のピッチ遅延である。
  17. 未処理の前記復号音声信号と前記次数間高調波濾波された周波数低帯域信号とを加算し、後処理された復号音声信号出力を生成するステップをさらに含む請求項16に記載の後処理の方法。
  18. 前記ピッチ強調するステップは、以下の式、
    Figure 0004842538
    を用いて前記復号音声信号をピッチ強調するステップを含む請求項1に記載の後処理の方法。ここで、x[n]は、前記復号音声信号、y[n]は、所与のサブ帯域中の前記ピッチ強調された復号音声信号、Tは、前記復号音声信号のピッチ遅延、αは、前記復号音声信号の次数間高調波の減衰量を制御するために0と1との間で変化する係数である。
  19. ビットストリームから前記ピッチ遅延Tを受け取るステップを含む請求項18に記載の後処理の方法。
  20. 受け取られた、符合化されたビットストリームから前記ピッチ遅延Tを復号するステップを含む請求項18に記載の後処理の方法。
  21. ピッチトラッキングの改善のために、前記復号音声信号に応答して前記ピッチ遅延Tを算出するステップを含む請求項18に記載の後処理の方法。
  22. 符号化の際、前記音声信号は、より高いサンプリング周波数からより低いサンプリング周波数にダウンサンプリングされ、かつ、前記復号音声信号を複数の周波数サブ帯域信号に分割するステップは、前記復号音声信号を前記より低いサンプリング周波数から前記より高いサンプリング周波数にアップサンプリングするステップを含む請求項1に記載の後処理の方法。
  23. 前記復号音声信号を複数の周波数サブ帯域信号に分割するステップは、前記復号音声信号をサブ帯域濾波するステップを含み、
    前記復号音声信号を前記より低いサンプリング周波数から前記より高いサンプリング周波数にアップサンプリングする前記アップサンプリングステップは、前記サブ帯域濾波ステップと組み合わされる請求項22に記載の後処理の方法。
  24. 前記復号音声信号を帯域通過濾波して周波数高帯域信号を生成するステップを含み、前記復号音声信号を帯域通過濾波するステップは、前記復号音声信号を前記より低いサンプリング周波数から前記より高いサンプリング周波数にアップサンプリングするステップと組み合わされ、
    前記復号音声信号をピッチ強調し、前記ピッチ強調された復号音声信号を低域通過濾波して周波数低帯域信号を生成するステップを含み、前記後処理されピッチ強調された復号音声信号を低域通過濾波する前記低域通過濾波ステップは、前記復号音声信号を前記より低いサンプリング周波数から前記より高いサンプリング周波数にアップサンプリングするステップと組み合わされる請求項22に記載の後処理の方法。
  25. 前記周波数高帯域信号と前記周波数低帯域信号とを加算し、後処理され、アップサンプリングされた復号音声信号出力を形成するステップをさらに含む請求項24に記載の後処理の方法。
  26. 前記復号音声信号をピッチ強調するステップは、前記復号音声信号を以下の式、
    Figure 0004842538
    を用いて処理するステップをさらに含む請求項24に記載の後処理の方法。ここで、x[n]は、前記復号音声信号、y[n]は、所与のサブ帯域中の前記ピッチ強調された復号音声信号、Tは、前記復号音声信号のピッチ遅延、αは、前記復号音声信号の次数間高調波の減衰量を制御するために0と1との間で変化する係数である。
  27. 前記復号音声信号を複数の周波数サブ帯域信号に分割するステップは、前記復号音声信号を周波数高帯域信号および周波数低帯域信号に分割するステップを含み、
    前記ピッチ強調するステップは、前記周波数低帯域信号をピッチ強調するステップを含む請求項1に記載の後処理の方法。
  28. 前記ピッチ強調するステップは、
    前記復号音声信号のピッチ値を決定するステップと、
    前記決定されたピッチ値に関して、前記復号音声信号の基本周波数よりも低いカットオフ周波数を有する高域通過フィルタを算出するステップと、
    前記算出された高域通過フィルタを用いて前記復号音声信号を処理するステップとを含む請求項1に記載の後処理の方法。
  29. 復号音声信号の知覚音質向上の観点に立った、前記復号音声信号を後処理するデバイスであって、
    前記復号音声信号を複数の周波数サブ帯域信号に分割する分割器と、
    記周波数サブ帯域信号の一部のみに対して後処理をする後処理器とを備えていて、
    前記後処理器は、前記復号音声信号の低周波数帯域のみの周波数サブ帯域信号をピッチ強調するピッチ強調器を含む
    ことを特徴とするデバイス。
  30. 記周波数サブ帯域信号の一部の後処理の後、前記周波数サブ帯域信号同士を加算し、後処理された復号音声信号出力を生成するための加算をさらに含む請求項29に記載の後処理用デバイス。
  31. 前記後処理は、前記復号音声信号が供給される適応型フィルタを含む請求項29に記載の後処理用デバイス。
  32. 前記分割は、前記復号音声信号が供給されるサブ帯域フィルタを含む請求項29に記載の後処理用デバイス。
  33. 前記周波数サブ帯域信号の一部に対して、
    前記後処理は、前記復号音声信号が供給され適応可能に濾波された復号音声信号を生成する適応型フィルタを含み、
    前記分割は、前記適応可能に濾波された復号音声信号が供給されるサブ帯域フィルタを含む請求項29に記載の後処理用デバイス。
  34. 前記分割は、
    前記復号音声信号が供給され周波数高帯域信号を生成する高域通過フィルタと、
    前記復号音声信号が供給され周波数低帯域信号を生成する第1低域通過フィルタと、
    前記第1低域通過フィルタを用いて前記復号音声信号を低域通過濾波する前に前記復号音声信号を強調するピッチ強調を含む請求項29に記載の後処理用デバイス。
  35. 前記後処理器は、前記復号音声信号が供給され前記ピッチ強調器に供給される低域通過濾波された復号音声信号を生成する第2低域通過フィルタをさらに含む請求項34に記載の後処理用デバイス。
  36. 前記周波数高帯域信号と前記周波数低帯域信号とを加算し、後処理された復号音声信号出力を生成するための加算器をさらに含む請求項34に記載の後処理用デバイス。
  37. 前記分割は、
    前記復号音声信号が供給され周波数高帯域信号を生成する帯域通過フィルタと、
    前記復号音声信号が供給され周波数低帯域信号を生成する低域通過フィルタと、
    前記低域通過フィルタを用いて前記復号音声信号を低域通過濾波して周波数低帯域信号を生成する前に前記復号音声信号を強調するピッチ強調器と
    を含む請求項29に記載の後処理用デバイス。
  38. 前記ピッチ強調器は、前記復号音声信号が供給され前記低域通過フィルタに供給されるピッチ強調された復号音声信号を生成するピッチフィルタを含む請求項37に記載の後処理用デバイス。
  39. 前記周波数高帯域信号と前記周波数低帯域信号とを加算し、後処理された復号音声信号出力を生成するための加算器をさらに含む請求項37に記載の後処理用デバイス。
  40. 前記分割は、
    前記復号音声信号が供給され周波数低帯域信号を生成する低域通過フィルタ
    前記復号音声信号を強調して前記低域通過フィルタに供給される後処理されピッチ強調された復号音声信号を生成するピッチ強調を含む請求項29に記載の後処理用デバイス。
  41. 前記ピッチ強調器は、前記復号音声信号が供給され次数間高調波が減衰された復号音声信号を生成する次数間高調波フィルタを含む請求項40に記載の後処理用デバイス。
  42. 前記ピッチ強調器は、前記次数間高調波が減衰された復号音声信号に適応型ピッチ強調利得を乗算する乗算器を含む請求項41に記載の後処理用デバイス。
  43. 前記復号音声信号が供給され前記次数間高調波フィルタに供給される低域通過濾波された復号音声信号を生成する低域通過フィルタをさらに含む請求項41に記載の後処理用デバイス。
  44. 前記復号音声信号と前記周波数低帯域信号とを加算し、後処理された復号音声信号出力を生成する加算器をさらに含む請求項40に記載の後処理用デバイス。
  45. 前記ピッチ強調器は、前記復号音声信号の次数間高調波を減衰させるために、以下の伝達関数、
    Figure 0004842538
    を有する次数間高調波フィルタを含む請求項40に記載の後処理用デバイス。ここで、x[n]は、前記復号音声信号、y[n]は、所与のサブ帯域中の前記次数間高調波濾波された復号音声信号、Tは、前記復号音声信号のピッチ遅延である。
  46. 未処理の前記復号音声信号と前記次数間高調波濾波された周波数低帯域信号とを加算し、後処理された復号音声信号出力を生成する加算器をさらに含む請求項45に記載の後処理用デバイス。
  47. 前記復号音声信号用ピッチ強調器は、以下の式、
    Figure 0004842538
    を使用する請求項29に記載の後処理用デバイス。ここで、x[n]は、前記復号音声信号、y[n]は、所与のサブ帯域中の前記ピッチ強調された復号音声信号、Tは、前記復号音声信号のピッチ遅延、αは、前記復号音声信号の次数間高調波の減衰量を制御するために0と1との間で変化する係数である。
  48. ビットストリームから前記ピッチ遅延Tを受け取る受信器を含む請求項47に記載の後処理用デバイス。
  49. 受け取られた、符合化されたビットストリームから前記ピッチ遅延Tを復号する復号器を含む請求項47に記載の後処理用デバイス。
  50. ピッチトラッキングの改善のために、前記復号音声信号に応答して前記ピッチ遅延Tを算出する算出器を含む請求項47に記載の後処理用デバイス。
  51. 符号化の際、前記音声信号は、より高いサンプリング周波数からより低いサンプリング周波数にダウンサンプリングされ、かつ、前記分割は、前記復号音声信号を前記より低いサンプリング周波数から前記より高いサンプリング周波数にアップサンプリングするアップサンプラを含む請求項29に記載の後処理用デバイス。
  52. 前記分割は、前記復号音声信号が供給されるサブ帯域フィルタを含み、かつ、前記アップサンプは、前記サブ帯域フィルタと組み合わされる請求項51に記載の後処理用デバイス。
  53. 前記ピッチ強調器は、
    前記復号音声信号を強調し
    前記分割は、
    前記復号音声信号が供給され周波数高帯域信号を生成し、かつ、前記アップサンプと組み合わされる帯域通過フィルタと、
    前記ピッチ強調された復号音声信号が供給され周波数低帯域信号を生成し、かつ、前記アップサンプと組み合わされる低域通過フィルタとを含む請求項51に記載の後処理用デバイス。
  54. 前記周波数高帯域信号と前記周波数低帯域信号とを加算し、ピッチ強調され、アップサンプリングされた復号音声信号出力を形成するための加算器をさらに含む請求項53に記載の後処理用デバイス。
  55. 前記ピッチ強調、以下の式、
    Figure 0004842538
    を用い請求項53に記載の後処理用デバイス。ここで、x[n]は、前記復号音声信号、y[n]は、所与のサブ帯域中の前記ピッチ強調された復号音声信号、Tは、前記復号音声信号のピッチ遅延、αは、前記復号音声信号の次数間高調波の減衰量を制御するために0と1との間で変化する係数である。
  56. 前記分割は、前記復号音声信号を周波数高帯域信号および周波数低帯域信号に分割
    前記ピッチ強調器は、前記周波数低帯域信号を強調る請求項29に記載の後処理用デバイス。
  57. 前記ピッチ強調器は、
    前記復号音声信号のピッチ値を決定
    前記決定されたピッチ値に関して、前記復号音声信号の基本周波数よりも低いカットオフ周波数を有する高域通過フィルタを算出
    前記算出された高域通過フィルタを用いて前記復号音声信号を処理する請求項29に記載の後処理用デバイス。
  58. 符号化音声信号を受信するための入力と、
    音声信号符号化パラメータを復号するために前記符号化音声信号が供給されるパラメータ復号器と、
    復号音声信号生成用の前記復号音声信号符号化パラメータが供給される音声信号復号器と、
    前記復号音声信号の知覚音質向上の観点に立った、前記復号音声信号を後処理するための請求項29から57のいずれかに記載の後処理デバイスとを含む音声信号復号器。
JP2004509925A 2002-05-31 2003-05-30 合成発話の周波数選択的ピッチ強調方法およびデバイス Expired - Lifetime JP4842538B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CA002388352A CA2388352A1 (en) 2002-05-31 2002-05-31 A method and device for frequency-selective pitch enhancement of synthesized speed
CA2,388,352 2002-05-31
PCT/CA2003/000828 WO2003102923A2 (en) 2002-05-31 2003-05-30 Methode and device for pitch enhancement of decoded speech

Publications (2)

Publication Number Publication Date
JP2005528647A JP2005528647A (ja) 2005-09-22
JP4842538B2 true JP4842538B2 (ja) 2011-12-21

Family

ID=29589086

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004509925A Expired - Lifetime JP4842538B2 (ja) 2002-05-31 2003-05-30 合成発話の周波数選択的ピッチ強調方法およびデバイス

Country Status (22)

Country Link
US (1) US7529660B2 (ja)
EP (1) EP1509906B1 (ja)
JP (1) JP4842538B2 (ja)
KR (1) KR101039343B1 (ja)
CN (1) CN100365706C (ja)
AT (1) ATE399361T1 (ja)
AU (1) AU2003233722B2 (ja)
BR (2) BR0311314A (ja)
CA (2) CA2388352A1 (ja)
CY (1) CY1110439T1 (ja)
DE (1) DE60321786D1 (ja)
DK (1) DK1509906T3 (ja)
ES (1) ES2309315T3 (ja)
HK (1) HK1078978A1 (ja)
MX (1) MXPA04011845A (ja)
MY (1) MY140905A (ja)
NO (1) NO332045B1 (ja)
NZ (1) NZ536237A (ja)
PT (1) PT1509906E (ja)
RU (1) RU2327230C2 (ja)
WO (1) WO2003102923A2 (ja)
ZA (1) ZA200409647B (ja)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6315985B1 (en) * 1999-06-18 2001-11-13 3M Innovative Properties Company C-17/21 OH 20-ketosteroid solution aerosol products with enhanced chemical stability
JP4380174B2 (ja) * 2003-02-27 2009-12-09 沖電気工業株式会社 帯域補正装置
US7619995B1 (en) * 2003-07-18 2009-11-17 Nortel Networks Limited Transcoders and mixers for voice-over-IP conferencing
FR2861491B1 (fr) * 2003-10-24 2006-01-06 Thales Sa Procede de selection d'unites de synthese
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
DE102004007191B3 (de) * 2004-02-13 2005-09-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
DE102004007184B3 (de) * 2004-02-13 2005-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
BRPI0510014B1 (pt) * 2004-05-14 2019-03-26 Panasonic Intellectual Property Corporation Of America Dispositivo de codificação, dispositivo de decodificação e método do mesmo
WO2005112001A1 (ja) * 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
US7848921B2 (en) * 2004-08-31 2010-12-07 Panasonic Corporation Low-frequency-band component and high-frequency-band audio encoding/decoding apparatus, and communication apparatus thereof
JP4407538B2 (ja) * 2005-03-03 2010-02-03 ヤマハ株式会社 マイクロフォンアレー用信号処理装置およびマイクロフォンアレーシステム
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
US8346546B2 (en) * 2006-08-15 2013-01-01 Broadcom Corporation Packet loss concealment based on forced waveform alignment after packet loss
WO2008072733A1 (ja) * 2006-12-15 2008-06-19 Panasonic Corporation 符号化装置および符号化方法
US8036886B2 (en) * 2006-12-22 2011-10-11 Digital Voice Systems, Inc. Estimation of pulsed speech model parameters
WO2008081920A1 (ja) * 2007-01-05 2008-07-10 Kyushu University, National University Corporation 音声強調処理装置
JP5046233B2 (ja) * 2007-01-05 2012-10-10 国立大学法人九州大学 音声強調処理装置
ES2394515T3 (es) 2007-03-02 2013-02-01 Telefonaktiebolaget Lm Ericsson (Publ) Métodos y adaptaciones en una red de telecomunicaciones
US8571852B2 (en) * 2007-03-02 2013-10-29 Telefonaktiebolaget L M Ericsson (Publ) Postfilter for layered codecs
ES2383365T3 (es) * 2007-03-02 2012-06-20 Telefonaktiebolaget Lm Ericsson (Publ) Post-filtro no causal
CN101266797B (zh) * 2007-03-16 2011-06-01 展讯通信(上海)有限公司 语音信号后处理滤波方法
US8639501B2 (en) * 2007-06-27 2014-01-28 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for enhancing spatial audio signals
WO2009004718A1 (ja) * 2007-07-03 2009-01-08 Pioneer Corporation 楽音強調装置、楽音強調方法、楽音強調プログラムおよび記録媒体
JP2009044268A (ja) * 2007-08-06 2009-02-26 Sharp Corp 音声信号処理装置、音声信号処理方法、音声信号処理プログラム、及び、記録媒体
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
KR101475724B1 (ko) * 2008-06-09 2014-12-30 삼성전자주식회사 오디오 신호 품질 향상 장치 및 방법
US8538749B2 (en) * 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
US8532998B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
WO2010031049A1 (en) * 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
GB2466668A (en) * 2009-01-06 2010-07-07 Skype Ltd Speech filtering
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
GB2473266A (en) 2009-09-07 2011-03-09 Nokia Corp An improved filter bank
JP5519230B2 (ja) * 2009-09-30 2014-06-11 パナソニック株式会社 オーディオエンコーダ及び音信号処理システム
ES2507165T3 (es) * 2009-10-21 2014-10-14 Dolby International Ab Sobremuestreo en un banco de filtros de reemisor combinado
ES2645415T3 (es) * 2009-11-19 2017-12-05 Telefonaktiebolaget Lm Ericsson (Publ) Métodos y disposiciones para la compensación de volumen y nitidez en códecs de audio
WO2011074233A1 (ja) * 2009-12-14 2011-06-23 パナソニック株式会社 ベクトル量子化装置、音声符号化装置、ベクトル量子化方法、及び音声符号化方法
WO2011128723A1 (en) * 2010-04-12 2011-10-20 Freescale Semiconductor, Inc. Audio communication device, method for outputting an audio signal, and communication system
US8886523B2 (en) * 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
WO2011127832A1 (en) * 2010-04-14 2011-10-20 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US8423357B2 (en) * 2010-06-18 2013-04-16 Alon Konchitsky System and method for biometric acoustic noise reduction
DK3079153T3 (en) 2010-07-02 2018-11-05 Dolby Int Ab AUDIO DECOD WITH SELECTIVE FILTERING
TWI484479B (zh) 2011-02-14 2015-05-11 Fraunhofer Ges Forschung 用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法
MX2013009304A (es) 2011-02-14 2013-10-03 Fraunhofer Ges Forschung Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad.
BR112013020592B1 (pt) 2011-02-14 2021-06-22 Fraunhofer-Gellschaft Zur Fôrderung Der Angewandten Forschung E. V. Codec de áudio utilizando síntese de ruído durante fases inativas
EP3239978B1 (en) 2011-02-14 2018-12-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of pulse positions of tracks of an audio signal
EP2550653B1 (en) 2011-02-14 2014-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Information signal representation using lapped transform
CN103503061B (zh) * 2011-02-14 2016-02-17 弗劳恩霍夫应用研究促进协会 在一频谱域中用以处理已解码音频信号的装置及方法
PL3385950T3 (pl) * 2012-05-23 2020-02-28 Nippon Telegraph And Telephone Corporation Sposoby dekodowania audio, dekodery audio oraz odpowiedni program i nośnik rejestrujący
FR3000328A1 (fr) * 2012-12-21 2014-06-27 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
US8927847B2 (en) * 2013-06-11 2015-01-06 The Board Of Trustees Of The Leland Stanford Junior University Glitch-free frequency modulation synthesis of sounds
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
JP6220610B2 (ja) * 2013-09-12 2017-10-25 日本電信電話株式会社 信号処理装置、信号処理方法、プログラム、記録媒体
CN110767241B (zh) * 2013-10-18 2023-04-21 瑞典爱立信有限公司 谱峰位置的编码与解码
JP6486962B2 (ja) 2014-04-17 2019-03-20 ヴォイスエイジ・コーポレーション 異なるサンプリングレートを有するフレーム間の移行による音声信号の線形予測符号化および復号のための方法、符号器および復号器
EP2980799A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
EP2980798A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
US9948261B2 (en) * 2014-11-20 2018-04-17 Tymphany Hk Limited Method and apparatus to equalize acoustic response of a speaker system using multi-rate FIR and all-pass IIR filters
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10109284B2 (en) * 2016-02-12 2018-10-23 Qualcomm Incorporated Inter-channel encoding and decoding of multiple high-band audio signals
EP3443557B1 (en) 2016-04-12 2020-05-20 Fraunhofer Gesellschaft zur Förderung der Angewand Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band
RU2676022C1 (ru) * 2016-07-13 2018-12-25 Общество с ограниченной ответственностью "Речевая аппаратура "Унитон" Способ повышения разборчивости речи
CN111128230B (zh) * 2019-12-31 2022-03-04 广州市百果园信息技术有限公司 语音信号重建方法、装置、设备和存储介质
US11270714B2 (en) 2020-01-08 2022-03-08 Digital Voice Systems, Inc. Speech coding using time-varying interpolation
CN113053353B (zh) * 2021-03-10 2022-10-04 度小满科技(北京)有限公司 一种语音合成模型的训练方法及装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SU447857A1 (ru) 1971-09-07 1974-10-25 Предприятие П/Я А-3103 Устройство дл записи информации на термопластический носитель
SU447853A1 (ru) 1972-12-01 1974-10-25 Предприятие П/Я А-7306 Устройство передачи и приема речевых сигналов
JPS6041077B2 (ja) * 1976-09-06 1985-09-13 喜徳 喜谷 1,2‐ジアミノシクロヘキサン異性体のシス白金(2)錯体
JP3137805B2 (ja) * 1993-05-21 2001-02-26 三菱電機株式会社 音声符号化装置、音声復号化装置、音声後処理装置及びこれらの方法
JP3321971B2 (ja) * 1994-03-10 2002-09-09 ソニー株式会社 音声信号処理方法
JP3062392B2 (ja) * 1994-04-22 2000-07-10 株式会社河合楽器製作所 波形形成装置およびこの出力波形を用いた電子楽器
BR9508554A (pt) * 1994-08-08 1997-11-25 Debiopharm Sa Preparação farmaceuticamente estável de oxaliplatina
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
GB9512284D0 (en) 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
US5864798A (en) * 1995-09-18 1999-01-26 Kabushiki Kaisha Toshiba Method and apparatus for adjusting a spectrum shape of a speech signal
US5806025A (en) * 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
US6385576B2 (en) * 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
GB9804013D0 (en) * 1998-02-25 1998-04-22 Sanofi Sa Formulations
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US7167828B2 (en) * 2000-01-11 2007-01-23 Matsushita Electric Industrial Co., Ltd. Multimode speech coding apparatus and decoding apparatus
JP3612260B2 (ja) * 2000-02-29 2005-01-19 株式会社東芝 音声符号化方法及び装置並びに及び音声復号方法及び装置
JP2002149200A (ja) * 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US6937978B2 (en) * 2001-10-30 2005-08-30 Chungwa Telecom Co., Ltd. Suppression system of background noise of speech signals and the method thereof
US6476068B1 (en) * 2001-12-06 2002-11-05 Pharmacia Italia, S.P.A. Platinum derivative pharmaceutical formulations
WO2005020980A1 (en) * 2003-08-28 2005-03-10 Mayne Pharma Pty Ltd Acid containing oxaliplatin formulations

Also Published As

Publication number Publication date
EP1509906B1 (en) 2008-06-25
KR101039343B1 (ko) 2011-06-08
DK1509906T3 (da) 2008-10-20
ES2309315T3 (es) 2008-12-16
WO2003102923A2 (en) 2003-12-11
MXPA04011845A (es) 2005-07-26
ZA200409647B (en) 2006-06-28
BR0311314A (pt) 2005-02-15
CN1659626A (zh) 2005-08-24
US7529660B2 (en) 2009-05-05
AU2003233722A1 (en) 2003-12-19
NZ536237A (en) 2007-05-31
HK1078978A1 (en) 2006-03-24
BRPI0311314B1 (pt) 2018-02-14
CA2483790A1 (en) 2003-12-11
AU2003233722B2 (en) 2009-06-04
CA2483790C (en) 2011-12-20
CY1110439T1 (el) 2015-04-29
DE60321786D1 (de) 2008-08-07
NO20045717L (no) 2004-12-30
NO332045B1 (no) 2012-06-11
JP2005528647A (ja) 2005-09-22
CA2388352A1 (en) 2003-11-30
CN100365706C (zh) 2008-01-30
RU2327230C2 (ru) 2008-06-20
EP1509906A2 (en) 2005-03-02
US20050165603A1 (en) 2005-07-28
RU2004138291A (ru) 2005-05-27
KR20050004897A (ko) 2005-01-12
ATE399361T1 (de) 2008-07-15
WO2003102923A3 (en) 2004-09-30
MY140905A (en) 2010-01-29
PT1509906E (pt) 2008-11-13

Similar Documents

Publication Publication Date Title
JP4842538B2 (ja) 合成発話の周波数選択的ピッチ強調方法およびデバイス
EP1141946B1 (en) Coded enhancement feature for improved performance in coding communication signals
US8892448B2 (en) Systems, methods, and apparatus for gain factor smoothing
US8078474B2 (en) Systems, methods, and apparatus for highband time warping
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
EP2577659B1 (en) Systems, methods, apparatus, and computer program products for wideband speech coding
KR101344174B1 (ko) 오디오 신호 처리 방법 및 오디오 디코더 장치
EP1509903B1 (en) Method and device for efficient frame erasure concealment in linear predictive based speech codecs
EP1125284B1 (en) High frequency content recovering method and device for over-sampled synthesized wideband signal
US20090299755A1 (en) Method for Post-Processing a Signal in an Audio Decoder
EP1564723A1 (en) Transcoder and coder conversion method
Garcia-Mateo et al. Modeling techniques for speech coding: a selected survey
How Wideband speech and audio compression for wireless communications
AU2757602A (en) Multimode speech encoder

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090924

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100511

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111006

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4842538

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141014

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term