JP6356159B2 - 潜在的なフレームの不安定性を軽減するためのシステムおよび方法 - Google Patents

潜在的なフレームの不安定性を軽減するためのシステムおよび方法 Download PDF

Info

Publication number
JP6356159B2
JP6356159B2 JP2015559227A JP2015559227A JP6356159B2 JP 6356159 B2 JP6356159 B2 JP 6356159B2 JP 2015559227 A JP2015559227 A JP 2015559227A JP 2015559227 A JP2015559227 A JP 2015559227A JP 6356159 B2 JP6356159 B2 JP 6356159B2
Authority
JP
Japan
Prior art keywords
frame
vector
current frame
lsf
spectral frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015559227A
Other languages
English (en)
Other versions
JP2016510134A (ja
JP2016510134A5 (ja
Inventor
スバシンガー、スバシンガー・シャミンダ
クリシュナン、ベンカテシュ
ラジェンドラン、ビベク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2016510134A publication Critical patent/JP2016510134A/ja
Publication of JP2016510134A5 publication Critical patent/JP2016510134A5/ja
Application granted granted Critical
Publication of JP6356159B2 publication Critical patent/JP6356159B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Meter Arrangements (AREA)
  • Catching Or Destruction (AREA)
  • Safety Devices In Control Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Systems (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Stored Programmes (AREA)
  • Electrotherapy Devices (AREA)

Description

関連出願
[0001] 本出願は、「SYSTEMS AND METHODS FOR CORRECTING A POTENTIAL LINE SPECTRAL FREQUENCY INSTABILITY」と題される2013年2月21日に出願された米国仮特許出願第61/767,431号に関し、その優先権を主張する。
[0002] 本開示は全般に、電子デバイスに関する。より具体的には、本開示は、潜在的なフレームの不安定性を軽減するためのシステムおよび方法(systems and methods for mitigating potential frame instability)に関する。
[0003] 最近の数十年で、電子デバイスの使用が一般的になった。特に、電子技術の進歩は、ますます複雑で有用になる電子デバイスのコストを下げた。コスト低減および消費者の需要により、電子デバイスが現代社会において事実上どこにでもあるほど電子デバイスの使用が激増した。電子デバイスの使用が拡大するにつれて、電子デバイスの新たな改善された機能に対する需要も拡大した。より具体的には、新しい機能を実行する、および/またはより高速に、より効率的に、もしくはより高い品質で機能を実行する、電子デバイスがしばしば求められる。
[0004] 一部の電子デバイス(たとえば、携帯電話、スマートフォン、オーディオレコーダ、カムコーダ、コンピュータなど)は、オーディオ信号を利用する。これらの電子デバイスは、オーディオ信号を符号化、記憶、および/または送信することができる。たとえば、スマートフォンは、電話呼のための音声信号を取得、符号化、および送信することができるが、別のスマートフォンは、音声信号を受信し、復号することができる。
[0005] しかしながら、オーディオ信号の符号化、送信、および復号において、特定の課題が生じる。たとえば、オーディオ信号を送信するために必要とされる帯域幅の量を減らすために、オーディオ信号が符号化され得る。オーディオ信号の一部分が送信において失われると、正確に復号されたオーディオ信号を提示することは困難であり得る。この議論から認識され得るように、復号を改善するシステムおよび方法が有益であり得る。
[0006] 電子デバイスによって潜在的なフレームの不安定性を軽減するための方法が説明される。方法は、消失したフレーム(erased frame)に時間的に後続するフレームを取得することを含む。方法はまた、フレームが潜在的に不安定かどうかを決定することを含む。方法はさらに、フレームが潜在的に不安定である場合、安定なフレームパラメータを生成するために代わりの重み付け値(substitute weighting value)を適用することを含む。フレームパラメータは、フレームの中間線スペクトル周波数ベクトル(frame mid line spectral frequency vector)であり得る。方法は、現在のフレームの中間線スペクトル周波数ベクトルを生成するために、受け取られた重み付けベクトル(weighting vector)を適用することを含み得る。
[0007] 代わりの重み付け値は0と1の間であり得る。安定なフレームパラメータを生成することは、代わりの重み付け値を、現在のフレームの最終線スペクトル周波数ベクトル(current frame end line spectral frequency vector)および以前のフレームの最終線スペクトル周波数ベクトル(previous frame end line spectral frequency vector)に適用することを含み得る。安定なフレームパラメータを生成することは、現在のフレームの最終線スペクトル周波数ベクトルと代わりの重み付け値との積と、以前のフレームの最終線スペクトル周波数ベクトルと1および代わりの重み付け値の差との積とを足したものに等しい、代わりの現在のフレームの中間線スペクトル周波数ベクトルを決定することを含み得る。代わりの重み付け値は、2つのフレームの分類と、2つのフレームの間の線スペクトル周波数の差との少なくとも1つに基づいて選択され得る。
[0008] フレームが潜在的に不安定であるかどうかを決定することは、現在のフレームの中間線スペクトル周波数が任意の並べ替え(reordering)の前の規則に従って順序付けられているかどうかに基づき得る。フレームが潜在的に不安定であるかどうかを決定することは、フレームが消失したフレームの後の閾値数のフレーム内にあるかどうかに基づき得る。フレームが潜在的に不安定であるかどうかを決定することは、フレームと消失したフレームとの間の任意のフレームが非予測的量子化(non-predictive quantization)を利用するかどうかに基づき得る。
[0009] 潜在的なフレームの不安定性を軽減するための電子デバイスも説明される。電子デバイスは、消失したフレームに時間的に後続するフレームを取得するフレームパラメータ決定回路を含む。電子デバイスはまた、フレームパラメータ決定回路に結合される安定性決定回路(stability determination circuitry)を含む。安定性決定回路は、フレームが潜在的に不安定かどうかを決定する。電子デバイスはさらに、安定性決定回路に結合される重み付け値置換回路(weighting value substitution circuitry)を含む。重み付け値置換回路は、フレームが潜在的に不安定である場合、安定なフレームパラメータを生成するために代わりの重み付け値を適用する。
[0010] 潜在的なフレームの不安定性を軽減するためのコンピュータプログラム製品も説明される。コンピュータプログラム製品は、命令を有する非一時的有形コンピュータ可読媒体(non-transitory tangible computer-readable medium)を含む。命令は、電子デバイスに、消失したフレームに時間的に後続するフレームを取得させるためのコードを含む。命令はまた、電子デバイスに、フレームが潜在的に不安定かどうかを決定させるためのコードを含む。命令はさらに、電子デバイスに、フレームが潜在的に不安定である場合、安定なフレームパラメータを生成するために代わりの重み付け値を適用させるためのコードを含む。
[0011] 潜在的なフレームの不安定性を軽減するための装置も説明される。装置は、消失したフレームに時間的に後続するフレームを取得するための手段を含む。装置はまた、フレームが潜在的に不安定かどうかを決定するための手段を含む。装置はさらに、フレームが潜在的に不安定である場合、安定なフレームパラメータを生成するために代わりの重み付け値を適用するための手段を含む。
[0012] エンコーダおよびデコーダの一般的な例を示すブロック図。 [0013] エンコーダおよびデコーダの基本的な実装形態の例を示すブロック図。 [0014] 広帯域音声エンコーダおよび広帯域音声デコーダの例を示すブロック図。 [0015] エンコーダのより具体的な例を示すブロック図。 [0016] 経時的なフレームの例を示す図。 [0017] エンコーダによって音声信号を符号化するための方法の一構成を示す流れ図。 [0018] 線スペクトル周波数(LSF)ベクトルの決定の例を示す図。 [0019] LSFの補間および外挿の例を示す2つの図。 [0020] 符号化された音声信号をデコーダによって復号するための方法の一構成を示す流れ図。 [0021] 密集したLSF次元(clustered LSF dimensions)の一例を示す図。 [0022] 密集したLSF次元によるアーティファクトの例を示すグラフ。 [0023] 潜在的なフレームの不安定性を軽減するために構成される電子デバイスの一構成を示すブロック図。 [0024] 潜在的なフレームの不安定性を軽減するための方法の一構成を示す流れ図。 [0025] 潜在的なフレームの不安定性を軽減するための方法のより具体的な構成を示す流れ図。 [0026] 潜在的なフレームの不安定性を軽減するための方法の別のより具体的な構成を示す流れ図。 [0027] 潜在的なフレームの不安定性を軽減するための方法の別のより具体的な構成を示す流れ図。 [0028] 合成された音声信号の例を示すグラフ。 [0029] 潜在的なフレームの不安定性を軽減するためのシステムおよび方法が実施され得るワイヤレス通信デバイスの一構成を示すブロック図。 [0030] 電子デバイスにおいて利用され得る様々なコンポーネントを示す図。
[0031] 次に、図を参照しながら様々な構成が説明され、ここで同様の参照番号は機能的に同様の要素を示し得る。本明細書で全般に説明され図に示されるシステムおよび方法は、多種多様な異なる構成で構成および設計され得る。したがって、図に表されるいくつかの構成の以下のより詳細な説明は、特許請求の範囲に記載されたように限定することは意図されず、システムおよび方法を代表するものにすぎない。
[0032] 図1は、エンコーダ104およびデコーダ108の一般的な例を示すブロック図である。エンコーダ104は音声信号102を受け取る。音声信号102は、任意の周波数範囲にある音声信号であり得る。たとえば、音声信号102は、0〜24キロヘルツ(kHz)という概略的な周波数範囲を伴う全帯域信号、0〜16kHzという概略的な周波数範囲を伴う超広帯域信号、0〜8kHzという概略的な周波数範囲を伴う広帯域信号、0〜4kHzという概略的な周波数範囲を伴う狭帯域信号、50〜300ヘルツ(Hz)という概略的な周波数範囲を伴う低域信号、または、4〜8kHzという概略的な周波数範囲を伴う高域信号であり得る。音声信号102の他の可能な周波数範囲は、300〜3400Hz(たとえば、公衆交換電話網(PSTN)の周波数範囲)、14〜20kHz、16〜20kHz、および16〜32kHzを含む。いくつかの構成では、音声信号102は、16kHzでサンプリングされてよく、0〜8kHzという概略的な周波数範囲を有し得る。
[0033] エンコーダ104は、符号化された音声信号106を生成するために音声信号102を符号化する。一般に、符号化された音声信号106は、音声信号102を表す1つまたは複数のパラメータを含む。パラメータの1つまたは複数は量子化され得る。1つまたは複数のパラメータの例は、フィルタパラメータ(たとえば、重み付け係数、線スペクトル周波数(LSF:line spectral frequency)、線スペクトル対(LSP:line spectral pair)、イミタンススペクトル周波数(ISF:immittance spectral frequency)、イミタンススペクトル対(ISP:immittance spectral pair)、部分相関(PARCOR:partial correlation)係数、反射係数(reflection coefficient)および/またはログ面積比(log-area-ratio)の値など)および符号化された励振信号(encoded excitation signal)に含まれるパラメータ(たとえば、ゲイン係数、適応コードブックインデックス、適応コードブックゲイン、固定コードブックインデックス、および/または固定コードブックゲインなど)を含む。パラメータは、1つまたは複数の周波数帯域に対応し得る。デコーダ108は、復号された音声信号110を生成するために符号化された音声信号106を復号する。たとえば、デコーダ108は、符号化された音声信号106に含まれる1つまたは複数のパラメータに基づいて、復号された音声信号110を構築する。復号された音声信号110は、元の音声信号102の概略的な再生であり得る。
[0034] エンコーダ104は、ハードウェア(たとえば、回路)、ソフトウェアまたは両方の組合せで実装され得る。たとえば、エンコーダ104は、特定用途向け集積回路(ASIC)、または命令を伴うプロセッサとして実装され得る。同様に、デコーダ108は、ハードウェア(たとえば、回路)、ソフトウェアまたは両方の組合せで実装され得る。たとえば、デコーダ108は、特定用途向け集積回路(ASIC)、または命令を伴うプロセッサとして実装され得る。エンコーダ104およびデコーダ108は、別々の電子デバイスまたは同じ電子デバイスに実装され得る。
[0035] 図2は、エンコーダ204およびデコーダ208の基本的な実装形態の例を示すブロック図である。エンコーダ204は、図1に関して説明されたエンコーダ104の一例であり得る。エンコーダ204は、分析モジュール212と、係数変換214と、量子化器A 216と、逆量子化器A 218と、逆係数変換A 220と、分析フィルタ222と、量子化器B 224とを含み得る。エンコーダ204および/またはデコーダ208のコンポーネントの1つまたは複数は、ハードウェア(たとえば、回路)、ソフトウェア、または両方の組合せで実装され得る。
[0036] エンコーダ204は音声信号202を受け取る。音声信号202は、図1に関連して上で説明されたような任意の周波数範囲(たとえば、音声周波数の全体の帯域または音声周波数のサブバンド)を含み得ることに留意されたい。
[0037] この例では、分析モジュール212は、音声信号202のスペクトルエンベロープを線形予測(LP:linear prediction)係数(たとえば、全極合成フィルタ1/A(z)を生成するために適用され得る分析フィルタ係数A(z)、ここでzは複素数である)のセットとして符号化する。分析モジュール212は通常、入力信号を音声信号202の一連の重複しないフレームとして処理し、各フレームまたはサブフレームについて係数の新しいセットが計算される。いくつかの構成では、フレーム期間は、音声信号202が局所的に静止していると予想され得る期間であり得る。フレーム期間の1つの一般的な例は20ミリ秒(ms)である(たとえば、8kHzのサンプリングレートにおいて160個のサンプルと等価である)。一例では、分析モジュール212は、各々の20ミリ秒のフレームのフォルマント構造(formant structure)を特徴付けるための10個の線形予測係数のセットを計算するように構成される。一連の重複するフレームとして音声信号202を処理するように分析モジュール212を実装することも可能である。
[0038] 分析モジュール212が各フレームのサンプルを直接分析するように構成されてよく、またはサンプルが最初に、窓関数(たとえば、ハミングウィンドウ)に従って重み付けられてよい。また、分析は、30ミリ秒のウィンドウのような、フレームよりも大きいウィンドウにわたって実行され得る。このウィンドウは、対称(たとえば、20ミリ秒のフレームの直前および直後に5ミリ秒を含むように、5−20−5)であってよく、または非対称(たとえば、先行するフレームの最後の10ミリ秒を含むように、10−20)であってよい。分析モジュール212は通常、レビンソンダービン(Levinson−Durbin)再帰法またはルルーゲゲン(Leroux−Gueguen)アルゴリズムを使用して線形予測係数を計算するように構成される。別の実装形態では、分析モジュールは、線形予測係数のセットの代わりに、各フレームについてケプストラム係数のセットを計算するように構成され得る。
[0039] エンコーダ204の出力レートは、係数を量子化することによって、再生品質への影響を相対的にほとんど伴わずに、著しく低減され得る。線形予測係数は、効率的に量子化することが困難であり、通常、量子化および/またはエントロピー符号化のために、LSFのような別の表現にマッピングされる。図2の例では、係数変換214は、係数のセットを対応するLSFベクトル(たとえば、LSF次元のセット)に変換する。係数の他の1対1の表現は、LSPと、PARCOR係数と、反射係数と、ログ面積比の値と、ISPと、ISFとを含む。たとえば、ISFは、GSM(登録商標)(Global System for Mobile Communications)AMR−WB(Adaptive Multirare−Wideband)コーデックで使用され得る。便宜的に、「線スペクトル周波数(line spectral frequency)」、「LSF次元(LSF dimension)」、「LSFベクトル(LSF vector)」という用語および関連する用語が、LSF、LSP、ISF、ISP、PARCOR係数、反射係数、およびログ面積比の値の1つまたは複数を指すために使用され得る。通常、係数のセットと対応するLSFベクトルとの間の変換は可逆であるが、いくつかの構成は、変換が誤差を伴わずに可逆ではないエンコーダ204の実装形態を含み得る。
[0040] 量子化器A 216は、LSFベクトル(または他の係数の表現)を量子化するように構成される。エンコーダ204は、この量子化の結果をフィルタパラメータ228として出力することができる。量子化器A 216は通常、入力ベクトル(たとえば、LSFベクトル)をテーブルまたはコードブック中の対応するベクトルエントリへのインデックスとして符号化するベクトル量子化器を含む。
[0041] 図2で見られるように、エンコーダ204はまた、係数のセットに従って構成された分析フィルタ222(白色化フィルタまたは予測誤差フィルタとも呼ばれる)を通じて音声信号202を渡すことによって残差信号を生成する。分析フィルタ222は、有限インパルス応答(FIR)フィルタまたは無限インパルス応答(IIR)フィルタとして実装され得る。この残差信号は通常、フィルタパラメータ228において表されていない、ピッチに関する長期的な構造のような、音声フレームの知覚的に重要な情報を含む。量子化器B 224は、符号化された励振信号226としての出力のために、この残差信号の量子化された表現を計算するように構成される。いくつかの構成では、量子化器B 224は、入力ベクトルをテーブルまたはコードブック中の対応するベクトルエントリへのインデックスとして符号化するベクトル量子化器を含む。加えて、または代替的に、量子化器B 224は、1つまたは複数のパラメータを送るように構成されてよく、ベクトルは、疎コードブック方法の場合のように、記憶装置から取り出されるのではなく、デコーダにおいてその1つまたは複数のパラメータから動的に生成され得る。そのような方法は、代数CELP(符号励振線形予測)のようなコーディング方式において、および3GPP2(第3世代パートナーシップ2)EVRC(Enhanced Variable Rate Codec)のようなコーデックにおいて使用される。いくつかの構成では、符号化された励振信号226およびフィルタパラメータ228が符号化された音声信号106に含まれ得る。
[0042] 対応するデコーダ208に対して利用可能となる同じフィルタパラメータ値に従って、符号化された励振信号226を生成することが、エンコーダ204にとって有益であり得る。このようにして、得られた符号化された励振信号226は、量子化誤差のような、それらのパラメータ値における非理想性をある程度すでに考慮していることがある。したがって、デコーダ208において利用可能となる同じ係数値を使用して分析フィルタ222を構成することが有益であり得る。図2に示されるようなエンコーダ204の基本的な例では、逆量子化器A 218は、フィルタパラメータ228を逆量子化する。逆係数変換A 220は、得られた値を係数の対応するセットにマッピングし返す。係数のこのセットは、量子化器B 224によって量子化される残差信号を生成するように分析フィルタ222を構成するために使用される。
[0043] エンコーダ204のいくつかの実装形態は、コードブックベクトルのセットの中で、残差信号と最も良く一致するものを特定することによって、符号化された励振信号226を計算するように構成される。しかしながら、エンコーダ204は、残差信号を実際に生成することなく残差信号の量子化された表現を計算するようにも実装され得ることに留意されたい。たとえば、エンコーダ204は、(たとえば、フィルタパラメータの現在のセットに従って)対応する合成された信号を生成するためにいくつかのコードブックベクトルを使用し、知覚的に重み付けられた領域において元の音声信号202と最も良く一致する、生成された信号と関連付けられるコードブックベクトルを選択するように構成され得る。
[0044] デコーダ208は、逆量子化器B 230と、逆量子化器C 236と、逆係数変換B 238と、合成フィルタ234とを含み得る。逆量子化器C 236は、フィルタパラメータ228(たとえば、LSFベクトル)を逆量子化し、逆係数変換B 238は、(たとえば、エンコーダ204の逆量子化器A 218および逆係数変換A 220に関して上で説明されたように)LSFベクトルを係数のセットへと変換する。逆量子化器B 230は、励振信号232を生成するために符号化された励振信号226を逆量子化する。係数および励振信号232に基づいて、合成フィルタ234は復号された音声信号210を合成する。言い換えると、合成フィルタ234は、復号された音声信号210を生成するために、逆量子化された係数に従って励振信号232をスペクトル的に成形するように構成される。いくつかの構成では、デコーダ208は励振信号232を別のデコーダに提供することもでき、別のデコーダは、別の周波数帯域(たとえば、高域)の励振信号を導出するために励振信号232を使用することができる。いくつかの実装形態では、デコーダ208は、スペクトル傾き、ピッチゲインおよびピッチラグ、ならびに音声モードのような、励振信号232に関する追加の情報を別のデコーダに提供するように構成され得る。
[0045] エンコーダ204およびデコーダ208のシステムは、合成による分析(analysis-by-synthesis)音声コーデックの基本的な例である。コードブック励振線形予測コーディングは、合成による分析コーディングの1つの一般的な群である。そのようなコーダの実装形態は、固定コードブックおよび適応コードブックからのエントリの選択、誤差最小化演算、ならびに/または知覚的重み付け演算のような演算を含む、残差の波形符号化を実行し得る。合成による分析コーディングの他の実装形態は、混合励振線形予測(MELP)コーディングと、代数CELP(ACELP)コーディングと、緩和CELP(RCELP)コーディングと、レギュラーパルス励振(RPE)コーディングと、マルチパルス励振(MPE)コーディングと、マルチパルスCELP(MP−CELP)コーディングと、ベクトル和励振線形予測(VSELP)コーディングとを含む。関連するコーディング方法は、マルチバンド励振(MBE)コーディングとプロトタイプ波形補間(PWI)コーディングとを含む。規格化された、合成による分析音声コーデックの例は、(残差励振線形予測(RELP)を使用する)ETSI(European Telecommunications Standards Institute)−GSM full rate codec(GSM 06.10)、GSM enhanced full rate codec(ETSI−GSM 06.60)、ITU(International Telecommunication Union)規格11.8キロビット毎秒(kbps) G.729 Annex E コーダ、IS(Interim Standard)−136(時分割多元接続方式)のためのIS−641コーデック、GSM適応マルチレート(GSM−AMR)コーデック、および4GV(登録商標)(Fourth−Generation Vocoder(登録商標))コーデック(QUALCOMM Incorporated、サンディエゴ、カリフォルニア州)を含む。エンコーダ204および対応するデコーダ208は、これらの技術のいずれかに従って、または、(A)フィルタを記述するパラメータのセットおよび(B)音声信号を再生するために記述されたフィルタを駆動するために使用される励振信号として音声信号を表す、任意の他の音声コーディング技術(知られているか、開発されることになるかにかかわらず)に従って、実装され得る。
[0046] 分析フィルタ222が音声信号202から粗いスペクトルエンベロープを除去した後でも、特に有声音声の場合、かなりの量の微細な高調波構造が残り得る。周期的な構造はピッチに関係し、同じ話者によって話される異なる有声音は、異なるフォルマント構造を有し得るが、同様のピッチ構造を有し得る。
[0047] コーディング効率および/または音声品質は、ピッチ構造の特性を符号化するために1つまたは複数のパラメータ値を使用することによって、向上され得る。ピッチ構造の1つの重要な特性は、(基本周波数とも呼ばれる)第1高調波の周波数であり、これは通常60〜400ヘルツ(Hz)の範囲内にある。この特性は通常、ピッチラグ(pitch lag)とも呼ばれる、基本周波数の逆数として符号化される。ピッチラグは、1つのピッチ周期中のサンプルの数を示し、1つまたは複数のコードブックインデックスとして符号化され得る。男性話者からの音声信号は、女性話者からの音声信号よりも大きいピッチラグを有する傾向がある。
[0048] ピッチ構造に関する別の信号特性は周期性であり、これは、高調波構造の強さ、または言い換えると、信号が高調波または非高調波である程度を示す。周期性の2つの典型的なインジケータは、ゼロクロスおよび正規化された自己相関関数(NACF:normalized autocorrelation function)である。周期性はピッチゲインによっても示されてよく、これは通常、コードブックゲイン(たとえば、量子化された適応コードブックゲイン)として符号化される。
[0049] エンコーダ204は、音声信号202の長期的な高調波構造を符号化するように構成される1つまたは複数のモジュールを含み得る。CELP符号化に対するいくつかの手法では、エンコーダ204は、短期的な特性または粗いスペクトルエンベロープを符号化する開ループ線形予測コーディング(LPC:linear predictive coding)分析モジュールを含み、その後に、微細なピッチ構造または高調波構造を符号化する閉ループ長期予測分析段階が続く。短期的な特性は係数(たとえば、フィルタパラメータ228)として符号化され、また、長期的な特性は、ピッチラグおよびピッチゲインのようなパラメータの値として符号化される。たとえば、エンコーダ204は、1つまたは複数のコードブックインデックス(たとえば、固定コードブックインデックスおよび適応コードブックインデックス)と対応するゲイン値とを含む形式で、符号化された励振信号226を出力するように構成され得る。(たとえば、量子化器B 224による)残差信号のこの量子化された表現の計算は、そのようなインデックスを選択することと、そのような値を計算することとを含み得る。ピッチ構造の符号化はまた、ピッチプロトタイプ波形の補間を含んでよく、その演算は、連続するピッチパルス間の差分を計算することを含んでよい。長期的な構造のモデリングは、通常はノイズ様(noise-like)であり構造化されていない無声音声に対応するフレームに対しては無効化され得る。
[0050] デコーダ208のいくつかの実装形態は、長期的な構造(ピッチ構造または高調波構造)が復元された後で、励振信号232を別のデコーダ(たとえば、高域デコーダ)に出力するように構成され得る。たとえば、そのようなデコーダは、符号化された励振信号226の逆量子化されたバージョンとして励振信号232を出力するように構成され得る。当然、他のデコーダが励振信号232を取得するために符号化された励振信号226の逆量子化を実行するように、デコーダ208を実装することも可能である。
[0051] 図3は、広帯域音声エンコーダ342および広帯域音声デコーダ358の例を示すブロック図である。広帯域音声エンコーダ342および/または広帯域音声デコーダ358の1つまたは複数のコンポーネントは、ハードウェア(たとえば、回路)、ソフトウェア、または両方の組合せで実装され得る。広帯域音声エンコーダ342および広帯域音声デコーダ358は、別々の電子デバイスまたは同じ電子デバイスに実装され得る。
[0052] 広帯域音声エンコーダ342は、フィルタバンクA 344と、第1の帯域エンコーダ348と、第2の帯域エンコーダ350とを含む。フィルタバンクA 344は、第1の帯域信号346a(たとえば、狭帯域信号)と第2の帯域信号346b(たとえば、高域信号)とを生成するために、広帯域音声信号340をフィルタリングするように構成される。
[0053] 第1の帯域エンコーダ348は、フィルタパラメータ352(たとえば、狭帯域(NB)フィルタパラメータ)と符号化された励振信号354(たとえば、符号化された狭帯域励振信号)とを生成するために、第1の帯域信号346aを符号化するように構成される。いくつかの構成では、第1の帯域エンコーダ348は、フィルタパラメータ352と符号化された励振信号354とを、コードブックインデックスとしてまたは別の量子化された形式で生成することができる。いくつかの構成では、第1の帯域エンコーダ348は、図2に関して説明されたエンコーダ204に従って実装され得る。
[0054] 第2の帯域エンコーダ350は、第2の帯域コーディングパラメータ356(たとえば、高域コーディングパラメータ)を生成するために、符号化された励振信号354中の情報に従って第2の帯域信号346b(たとえば、高域信号)を符号化するように構成される。第2の帯域エンコーダ350は、第2の帯域コーディングパラメータ356をコードブックインデックスとしてまたは別の量子化された形式で生成するように構成され得る。広帯域音声エンコーダ342の1つの具体的な例は、約8.55kbpsのレートで広帯域音声信号340を符号化するように構成され、約7.55kbpsがフィルタパラメータ352および符号化された励振信号354のために使用され、約1kbpsが第2の帯域コーディングパラメータ356のために使用される。いくつかの実装形態では、フィルタパラメータ352、符号化された励振信号354、および第2の帯域コーディングパラメータ356が、符号化された音声信号106に含まれ得る。
[0055] いくつかの構成では、第2の帯域エンコーダ350は、図2に関して説明されたエンコーダ204と同様に実装され得る。たとえば、第2の帯域エンコーダ350は、図2に関して説明されたエンコーダ204に関して説明されたような、第2の帯域フィルタパラメータを(たとえば、第2の帯域コーディングパラメータ356の一部として)生成することができる。しかしながら、第2の帯域エンコーダ350はいくつかの点で異なり得る。たとえば、第2の帯域エンコーダ350は、符号化された励振信号354に基づいて第2の帯域励振信号を生成し得る、第2の帯域励振生成器を含み得る。第2の帯域エンコーダ350は、合成された第2の帯域信号を生成し第2の帯域ゲイン係数を決定するために、第2の帯域励振信号を利用することができる。いくつかの構成では、第2の帯域エンコーダ350は、第2の帯域ゲイン係数を量子化することができる。したがって、第2の帯域コーディングパラメータ356の例は、第2の帯域フィルタパラメータと量子化された第2の帯域ゲイン係数とを含む。
[0056] フィルタパラメータ352と、符号化された励振信号354と、第2の帯域コーディングパラメータ356とを単一のビットストリームへと組み合わせることが、有益であり得る。たとえば、(たとえば、有線の、光の、またはワイヤレスの送信チャネル上での)送信のために、または記憶のために、符号化された信号を符号化された広帯域音声信号として一緒に多重送信することが有益であり得る。いくつかの構成では、広帯域音声エンコーダ342は、フィルタパラメータ352と、符号化された励振信号354と、第2の帯域コーディングパラメータ356とを、多重送信される信号へと組み合わせるように構成される、マルチプレクサ(図示されず)を含む。フィルタパラメータ352、符号化された励振信号354、および第2の帯域コーディングパラメータ356が、図1に関して説明されたような、符号化された音声信号106に含まれるパラメータの例であり得る。
[0057] いくつかの実装形態では、広帯域音声エンコーダ342を含む電子デバイスは、多重送信された信号を、有線の、光の、またはワイヤレスのチャネルのような送信チャネルに送信するように構成される回路も含み得る。そのような電子デバイスはまた、誤り訂正符号化(たとえば、レート互換畳み込み符号化)および/または誤り検出符号化(たとえば、巡回冗長符号化)、および/またはネットワークプロトコルの1つまたは複数のレイヤの符号化(たとえば、イーサネット(登録商標)、送信制御プロトコル/インターネットプロトコル(TCP/IP)、cdma2000など)のような、1つまたは複数のチャネル符号化動作を信号に対して実行するように構成され得る。
[0058] フィルタパラメータ352および符号化された励振信号354が高域信号および/または低域信号のような多重送信される信号の別の部分とは独立に復元され復号され得るように、マルチプレクサが、フィルタパラメータ352と符号化された励振信号354とを多重送信される信号の分離可能なサブストリームとして埋め込むように構成されることが、有益であり得る。たとえば、第2の帯域コーディングパラメータ356を取り除くことによってフィルタパラメータ352および符号化された励振信号354が復元され得るように、多重送信される信号が構成され得る。そのような特徴の1つの潜在的な利点は、フィルタパラメータ352および符号化された励振信号354の復号をサポートするが第2の帯域コーディングパラメータ356の復号をサポートしないシステムに第2の帯域コーディングパラメータ356を渡す前に、第2の帯域コーディングパラメータ356をトランスコードする必要をなくすことである。
[0059] 広帯域音声デコーダ358は、第1の帯域デコーダ360と、第2の帯域デコーダ366と、フィルタバンクB 368とを含み得る。第1の帯域デコーダ360(たとえば、狭帯域デコーダ)は、復号された第1の帯域信号362a(たとえば、復号された狭帯域信号)を生成するために、フィルタパラメータ352と符号化された励振信号354とを復号するように構成される。第2の帯域デコーダ366は、復号された第2の帯域信号362b(たとえば、復号された高域信号)を生成するために、符号化された励振信号354に基づいて、励振信号364(たとえば、狭帯域励振信号)に従って第2の帯域コーディングパラメータ356を復号するように構成される。この例では、第1の帯域デコーダ360は、励振信号364を第2の帯域デコーダ366に提供するように構成される。フィルタバンク368は、復号された広帯域音声信号370を生成するために、復号された第1の帯域信号362aと復号された第2の帯域信号362bとを組み合わせるように構成される。
[0060] 広帯域音声デコーダ358のいくつかの実装形態は、フィルタパラメータ352と、符号化された励振信号354と、第2の帯域コーディングパラメータ356とを、多重送信された信号から生成するように構成される、デマルチプレクサ(図示されず)を含み得る。広帯域音声エンコーダ358を含む電子デバイスは、多重送信された信号を、有線の、光の、またはワイヤレスのチャネルのような送信チャネルから受信するように構成される回路を含み得る。そのような電子デバイスはまた、誤り訂正復号(たとえば、レート互換畳み込み復号)および/または誤り検出復号(たとえば、巡回冗長復号)、および/またはネットワークプロトコルの1つまたは複数のレイヤの復号(たとえば、イーサネット、TCP/IP、cdma2000)のような、1つまたは複数のチャネル復号動作を信号に対して実行するように構成され得る。
[0061] 広帯域音声エンコーダ342中のフィルタバンクA 344は、第1の帯域信号346a(たとえば、狭帯域または低周波サブバンド信号)と第2の帯域信号346b(たとえば、高域または高周波サブバンド信号)とを生成するために、帯域分割方式に従って入力信号をフィルタリングするように構成される。具体的な用途の設計基準に応じて、出力サブバンドは、等しいまたは等しくない帯域幅を有することがあり、重複することも重複しないこともある。2つより多くのサブバンドを生成するフィルタバンクA 344の構成も可能である。たとえば、フィルタバンクA 344は、第1の帯域信号346aの周波数範囲を下回る周波数範囲(たとえば、50〜300ヘルツ(Hz)の範囲など)の成分を含む、1つまたは複数の低域信号を生成するように構成され得る。フィルタバンクA 344はまた、第2の帯域信号346bの周波数範囲を上回る周波数範囲(たとえば、14〜20、16〜20、または16〜32キロヘルツ(kHz)の範囲など)の成分を含む1つまたは複数の追加の高域信号を生成するように構成されることも可能である。そのような構成では、広帯域音声エンコーダ342は、この1つまたは複数の信号を別々に符号化するように実装されてよく、マルチプレクサは、追加の符号化された1つまたは複数の信号を(たとえば、1つまたは複数の分離可能な部分として)多重送信される信号に含めるように構成され得る。
[0062] 図4は、エンコーダ404のより具体的な例を示すブロック図である。具体的には、図4は、低ビットレートの音声符号化のための、CELP合成による分析アーキテクチャを示す。この例では、エンコーダ404は、フレーミング 事前処理モジュール472と、分析モジュール476と、係数変換478と、量子化器480と、合成フィルタ484と、加算器488と、知覚的重み付けフィルタ(perceptual weighting filter)および誤差最小化モジュール492と、励振推定モジュール494とを含む。エンコーダ404およびエンコーダ404のコンポーネントの1つまたは複数は、ハードウェア(たとえば、回路)、ソフトウェアまたは両方の組合せで実装され得ることに留意されたい。
[0063] 音声信号402(たとえば、入力音声s)は、音声情報を含む電気信号であり得る。たとえば、音響的な音声信号(acoustic speech signal)が、マイクロフォンによって捉えられ、音声信号402を生成するためにサンプリングされ得る。いくつかの構成では、音声信号402は16kHzでサンプリングされ得る。音声信号402は、図1に関して上で説明されたような周波数の範囲を備え得る。
[0064] 音声信号402は、フレーミングおよび事前処理モジュール472に提供され得る。フレーミングおよび事前処理モジュール472は、音声信号402を一連のフレームに分割し得る。各フレームは、特定の時間期間であり得る。たとえば、各フレームは、音声信号402の20ミリ秒に相当し得る。フレーミングおよび事前処理モジュール472は、フィルタリング(たとえば、ローパスフィルタリング、ハイパスフィルタリング、およびバンドパスフィルタリングの1つまたは複数)のような他の動作を、音声信号に対して実行することができる。したがって、フレーミングおよび事前処理モジュール472は、音声信号402に基づいて事前処理された音声信号474(たとえば、S(l)、ここでlはサンプル番号である)を生成することができる。
[0065] 分析モジュール476は、係数のセット(たとえば、線形予測分析フィルタA(z))を決定することができる。たとえば、分析モジュール476は、図2に関して説明されたような係数のセットとして、事前処理された音声信号474のスペクトルエンベロープを符号化することができる。
[0066] 係数は、係数変換478に提供され得る。係数変換478は、係数のセットを図2に関して上で説明されたような対応するLSFベクトル(たとえば、LSF、LSP、ISF、ISPなど)に変換する。
[0067] LSFベクトルは量子化器480に提供される。量子化器480は、LSFベクトルを量子化されたLSFベクトル482へと量子化する。たとえば、量子化器480は、量子化されたLSFベクトル482を得るために、LSFベクトルに対してベクトル量子化を実行することができる。いくつかの構成では、LSFベクトルは、サブフレームごとに生成および/量子化され得る。これらの構成では、あるサブフレーム(たとえば、各フレームの最後のサブフレームまたは最終サブフレーム)に対応する量子化されたLSFベクトルのみが、音声デコーダに送られ得る。これらの構成では、量子化器480はまた、量子化された重み付けベクトル441を決定することができる。重み付けベクトルは、送られるサブフレームに対応するLSFベクトルの間のLSFベクトル(たとえば、中間LSFベクトル(mid LSF vector))を量子化するために使用され得る。重み付けベクトルは量子化され得る。たとえば、量子化器480は、実際の重み付けベクトルと最も良く一致する重み付けベクトルに対応する、コードブックまたは参照テーブルのインデックスを決定することができる。量子化された重み付けベクトル441(たとえば、インデックス)は音声デコーダに送られ得る。量子化された重み付けベクトル441および量子化されたLSFベクトル482は、図2に関して上で説明されたフィルタパラメータ228の例であり得る。
[0068] 量子化器480は、各フレームの予測モードを示す予測モードインジケータ481を生成することができる。予測モードインジケータ481はデコーダに送られ得る。いくつかの構成では、予測モードインジケータ481は、フレームに対して2つの予測モードの1つ(たとえば、予測的量子化が利用されるか非予測的量子化が利用されるか)を示し得る。たとえば、予測モードインジケータ481は、フレームが先行するフレームに基づいて量子化される(たとえば、予測的)かそうではないか(たとえば、非予測的)を示し得る。予測モードインジケータ481は、現在のフレームの予測モードを示し得る。いくつかの構成では、予測モードインジケータ481は、フレームが予測的量子化により量子化されるか非予測的量子化により量子化されるかを示す、デコーダに送られるビットであり得る。
[0069] 量子化されたLSFベクトル482は合成フィルタ484に提供される。合成フィルタ484は、LSFベクトル482(たとえば、量子化された係数)および励振信号496に基づいて、合成された音声信号486(たとえば、再構築された音声
Figure 0006356159
、ここでlはサンプル番号である)を生成する。たとえば、合成フィルタ484は、量子化されたLSFベクトル482(たとえば、1/A(z))に基づいて励振信号496をフィルタリングする。
[0070] 合成された音声信号486は、誤差信号490(予測誤差信号とも呼ばれる)を得るために、加算器488によって事前処理された音声信号474から差し引かれる。誤差信号490は、知覚的重み付けフィルタおよび誤差最小化モジュール492に提供される。
[0071] 知覚的重み付けフィルタおよび誤差最小化モジュール492は、誤差信号490に基づいて、重み付けられた誤差信号493を生成する。たとえば、誤差信号490の成分(たとえば、周波数成分)のすべてが、合成された音声信号の知覚的品質に等しく影響を与えるとは限らない。いくつかの周波数帯域における誤差は、他の周波数帯域における誤差よりも、音声品質に対して大きな影響を有する。知覚的重み付けフィルタおよび誤差最小化モジュール492は、音声品質に対する影響がより大きい周波数成分における誤差を低減し、音声品質に対する影響がより小さい他の周波数成分により多くの誤差を分配する、重み付けられた誤差信号493を生成することができる。
[0072] 励振推定モジュール494は、知覚的重み付けフィルタおよび誤差最小化モジュール492の出力に基づいて、励振信号496と符号化された励振信号498とを生成する。たとえば、励振推定モジュール494は、誤差信号490(たとえば、重み付けられた誤差信号493)を特徴付ける、1つまたは複数のパラメータを推定する。符号化された励振信号498は、1つまたは複数のパラメータを含んでよく、デコーダに送られてよい。CELP手法では、たとえば、励振推定モジュール494は、誤差信号490(たとえば、重み付けられた誤差信号493)を特徴付ける、適応(またはピッチ)コードブックインデックス、適応(またはピッチ)コードブックゲイン、固定コードブックインデックス、および固定コードブックゲインのような、パラメータを決定することができる。これらのパラメータに基づいて、励振推定モジュール494は、合成フィルタ484に提供される励振信号496を生成することができる。この手法では、適応コードブックインデックス、適応コードブックゲイン(たとえば、量子化された適応コードブックゲイン)、固定コードブックインデックス、および固定コードブックゲイン(たとえば、量子化された固定コードブックゲイン)が、符号化された励振信号498としてデコーダに送られ得る。
[0073] 符号化された励振信号498は、図2に関して上で説明された符号化された励振信号226の例であり得る。したがって、量子化された重み付けベクトル441、量子化されたLSFベクトル482、符号化された励振信号498、および/または予測モードインジケータ481は、図1に関して上で説明されたような符号化された音声信号106に含まれ得る。
[0074] 図5は、時間501にわたるフレーム503の例を示す図である。各フレーム503は、いくつかのサブフレーム505に分割される。図5に示される例では、以前のフレームA 503aは4個のサブフレーム505a〜dを含み、以前のフレームB 503bは4個のサブフレーム505e〜hを含み、現在のフレームC 503cは4個のサブフレーム505i〜lを含む。通常のフレーム503は、20ミリ秒という時間期間を占有してよく、4個のサブフレームを含んでよいが、異なる長さのフレームおよび/または異なる数のサブフレームが使用され得る。各フレームは、対応するフレーム番号とともに表されてよく、nは現在のフレーム(たとえば、現在のフレームC 503c)を表す。さらに、各サブフレームは対応するサブフレーム番号kとともに表され得る。
[0075] 図5は、エンコーダにおけるLSF量子化の一例を示すために使用され得る。フレームn中の各サブフレームkは対応するLSFベクトル
Figure 0006356159
を有し、分析および合成フィルタにおいて使用するためにk={1,2,3,4}である。現在のフレームの最終LSFベクトル527(たとえば、n番目のフレームの最後のサブフレームLSFベクトル)は
Figure 0006356159
と表され、ここで
Figure 0006356159
である。現在のフレームの中間LSFベクトル525(たとえば、n番目のフレームの中間LSFベクトル)は
Figure 0006356159
と表される。「中間LSFベクトル」は、時間501における、他のLSFベクトルの間の(たとえば、
Figure 0006356159

Figure 0006356159
との間の)LSFベクトルである。以前のフレームの最終LSFベクトル523の一例が図5に示され、
Figure 0006356159
と表され、ここで
Figure 0006356159
である。本明細書で使用される場合、「以前のフレーム(previous frame)」という用語は現在のフレームの前の任意のフレーム(たとえば、n−1、n−2,n−3など)を指し得る。したがって、「以前のフレームの最終LSFベクトル(previous frame end LSF vector)」は、現在のフレームの前の任意のフレームに対応する最終LSFベクトルであり得る。図5に示される例では、以前のフレームの最終LSFベクトル523は、現在のフレームC 503c(たとえば、フレームn)の直前の、以前のフレームB 503b(たとえば、フレームn−1)の最後のサブフレーム505hに対応する。
[0076] 各LSFベクトルはM次元であり、ここでLSFベクトルの各次元は単一のLSF次元またはLSF値に対応する。たとえば、Mは通常、広帯域音声(たとえば、16kHzでサンプリングされる音声)に対しては16である。フレームnのk番目のサブフレームのi番目のLSF次元は
Figure 0006356159
と表され、ここでi={1,2,...,M}である。
[0077] フレームnの量子化処理において、最終LSFベクトル
Figure 0006356159
が最初に量子化され得る。この量子化は、非予測的である(たとえば、以前のLSFベクトル
Figure 0006356159
が量子化処理において使用されない)か予測的である(たとえば、以前のLSFベクトル
Figure 0006356159
が量子化処理において使用される)かのいずれかであり得る。中間LSFベクトル
Figure 0006356159
が次いで量子化され得る。たとえば、エンコーダは、
Figure 0006356159
が式(1)において提供されるようなものとなるように、重み付けベクトルを選択することができる。
Figure 0006356159
[0078] 重み付けベクトルwnのi番目の次元は、単一の重みに対応し、wi、nによって表され、ここでi={1,2,...,M}である。wi、nは制約されないことにも留意されたい。具体的には、0≦wi、n≦1が
Figure 0006356159
および
Figure 0006356159
によって境界が区切られる値をもたらし、wi、n<0またはwi、n>1である場合、得られた中間LSFベクトル
Figure 0006356159
は、範囲
Figure 0006356159
の外側にあり得る。エンコーダは、量子化された中間LSFベクトルが、二乗平均誤差(MSE:mean squared error)または対数スペクトル歪み(LSD:log spectral distortion)のような何らかの歪みの尺度に基づいて、エンコーダにおける実際の中間LSFベクトルに最も近くなるように、重み付けベクトルwnを決定する(たとえば、選択する)ことができる。量子化処理において、エンコーダは、最終LSFベクトル
Figure 0006356159
の量子化インデックスと、重み付けベクトルwnのインデックスとを送信して、このことは、デコーダが
Figure 0006356159

Figure 0006356159
とを再構築することを可能にする。
[0079] サブフレームLSFベクトル
Figure 0006356159
は、
Figure 0006356159

Figure 0006356159
、および
Figure 0006356159
に基づいて、式(2)によって与えられるような補間係数αkとβkとを使用して補間される。
Figure 0006356159
αkおよびβkは、0≦(αk,βk)≦1となるようなものであり得ることに留意されたい。補間係数αkおよびβkは、エンコーダとデコーダの両方に知られている所定の値であり得る。
[0080] 図6は、エンコーダ404によって音声信号を符号化するための方法600の一構成を示す流れ図である。たとえば、エンコーダ404を含む電子デバイスは方法600を実行することができる。図6は、現在のフレームnに対するLSF量子化手順を示す。
[0081] エンコーダ404は、以前のフレームの量子化された最終LSFベクトルを取得することができる(602)。たとえば、エンコーダ404は、以前のフレームn−1に対応する最終LSFに最も近いコードブックベクトルを選択することによって、以前のフレーム(たとえば、
Figure 0006356159
)に対応する最終LSFベクトルを量子化することができる。
[0082] エンコーダ404は、現在のフレームの最終LSFベクトル(たとえば、
Figure 0006356159
)を量子化することができる(604)。エンコーダ404は、予測的LSF量子化が使用される場合、以前のフレームの最終LSFベクトルに基づいて現在のフレームの最終LSFベクトルを量子化する(604)。しかしながら、現在のフレームのLSFベクトルを量子化すること(604)は、非予測的量子化が現在のフレームの最終LSFベクトルのために使用される場合、以前のフレームの最終LSFベクトルに基づかない。
[0083] エンコーダ404は、重み付けベクトル(たとえば、wn)を決定することによって、現在のフレームの中間LSFベクトル(たとえば、
Figure 0006356159
)を量子化することができる(606)。たとえば、エンコーダ404は、実際の中間LSFベクトルに最も近い量子化された中間LSFベクトルをもたらす、重み付けベクトルを選択することができる。式(1)に示されるように、量子化された中間LSFベクトルは、重み付けベクトル、以前のフレームの最終LSFベクトル、および現在のフレームの最終LSFベクトルに基づき得る。
[0084] エンコーダ404は、量子化された現在のフレームの最終LSFベクトルと重み付けベクトルとをデコーダに送ることができる(608)。たとえば、エンコーダ404は、現在のフレームの最終LSFベクトルと重み付けベクトルとを電子デバイス上の送信機に提供することができ、送信機はそれらを別の電子デバイス上のデコーダに送信することができる。
[0085] 図7は、LSFベクトルの決定の例を示す図である。図7は、時間701にわたる、以前のフレームA 703a(たとえば、フレームn−1)と現在のフレームB 703b(たとえば、フレームn)とを示す。この例では、音声サンプルは重み付けフィルタを使用して重み付けられ、次いでLSFベクトルの決定(たとえば、計算)のために使用される。第1に、エンコーダ404における重み付けフィルタが、以前のフレームの最終LSFベクトル(たとえば、
Figure 0006356159
)を決定する(707)ために使用される。第2に、エンコーダ404における重み付けフィルタが、現在のフレームの最終LSFベクトル(たとえば、
Figure 0006356159
)を決定する(709)ために使用される。第3に、エンコーダ404における重み付けフィルタが、現在のフレームの中間LSFベクトル(たとえば、
Figure 0006356159
)を決定する(711)(たとえば、計算する)ために使用される。
[0086] 図8は、LSFの補間および外挿の例を示す2つの図を含む。例A 821aの横軸はHz単位の周波数819aを示し、例B 821bの横軸もHz単位の周波数819bを示す。具体的には、いくつかのLSF次元は図8では周波数領域で表される。しかしながら、LSF次元(たとえば、周波数、角度、値など)を表す複数の方法があることに留意されたい。したがって、例A 821aおよび例B 821aの横軸819a〜bは、他の単位で記述され得る。
[0087] 例A 821aは、LSFベクトルの第1の次元を考慮する補間の場合を示す。上で説明されたように、LSF次元は、LSFベクトルの単一のLSF次元またはLSF値を指す。具体的には、例A 821aは500Hzにおける以前のフレームの最終LSF次元813a(たとえば、
Figure 0006356159
)と、800Hzにおける現在のフレームの最終LSF次元(たとえば、
Figure 0006356159
)817aとを示す。例A 821aでは、第1の重み(たとえば、重み付けベクトルwnまたはwl,nの第1の次元)が、周波数819aにおける、以前のフレームの最終LSF次元(たとえば、
Figure 0006356159
)813aと現在のフレームの最終LSF次元(たとえば、
Figure 0006356159
)817aとの間の、現在のフレームの中間LSFベクトルの中間LSF次元(たとえば、
Figure 0006356159
)815aを量子化して示すために使用され得る。たとえば、wl,n=0.5、
Figure 0006356159
、および
Figure 0006356159
である場合、次いで例A 821aに示されるように、
Figure 0006356159
である。
[0088] 例B 821bは、LSFベクトルの第1のLSF次元を考慮する外挿の場合を示す。具体的には、例B 821bは500Hzにおける以前のフレームの最終LSF次元(たとえば、
Figure 0006356159
)813bと、800Hzにおける現在のフレームの最終LSF次元(たとえば、
Figure 0006356159
)817bとを示す。例B 821bでは、第1の重み(たとえば、重み付けベクトルwnまたはwl,nの第1の次元)が、周波数819bにおける、以前のフレームの最終LSF次元(たとえば、
Figure 0006356159
)813bと現在のフレームの最終LSF次元(たとえば、
Figure 0006356159
)817bとの間にない、現在のフレームの中間LSFベクトルの中間LSF次元(たとえば、
Figure 0006356159
)815bを量子化して示すために使用され得る。例B 821bに示されるように、たとえば、
Figure 0006356159

Figure 0006356159
、および
Figure 0006356159
である場合、次いで
Figure 0006356159
である。
[0089] 図9は、符号化された音声信号をデコーダによって復号するための方法900の一構成を示す流れ図である。たとえば、デコーダを含む電子デバイスは方法900を実行することができる。
[0090] デコーダは、以前のフレームの逆量子化された最終LSFベクトル(たとえば、
Figure 0006356159
)を取得することができる(902)。たとえば、デコーダは、以前に復号された(または、フレーム消失の場合は推定された)以前のフレームに対応する逆量子化された最終LSFベクトルを取り出すことができる。
[0091] デコーダは、現在のフレームの最終LSFベクトル(たとえば、
Figure 0006356159
)を逆量子化することができる(904)。たとえば、デコーダは、受け取られたLSFベクトルインデックスに基づいて、コードブックまたはテーブルにおいて現在のフレームのLSFベクトルを探すことによって、現在のフレームの最終LSFベクトルを逆量子化することができる(904)。
[0092] デコーダは、重み付けベクトル(たとえば、wn)に基づいて、現在のフレームの中間LSFベクトル(たとえば、
Figure 0006356159
)を決定することができる(906)。たとえば、デコーダは、エンコーダから重み付けベクトルを受け取ることができる。デコーダは次いで、式(1)に示されるように、以前のフレームの最終LSFベクトル、現在のフレームの最終LSFベクトル、および重み付けベクトルに基づいて、現在のフレームの中間LSFベクトルを決定することができる(906)。上で説明されたように、各LSFベクトルは、M個の次元またはLSF次元(たとえば、16個のLSF次元)を有し得る。LSFベクトルが安定的となるためには、LSFベクトル中のLSF次元の2つ以上の間に最小限の離隔(minimum separation)がなければならない。しかしながら、最小限の離隔のみを伴って密集している複数のLSF次元がある場合、次いで、かなりの確率で不安定なLSFベクトルがある。上で説明されたように、デコーダは、LSFベクトル中のLSF次元の2つ以上の間に最小限に満たない離隔しかない場合、LSFベクトルを並べ替えることができる。
[0093] 重み付けと、LSFベクトルの補間および/または外挿とのための、図4〜図9に関して説明された手法は、クリーンチャネルの条件(フレーム消失および/または送信エラーが伴わない)では良好に動作する。しかしながら、この手法は、1つまたは複数のフレーム消失が発生するといくつかの重大な問題を有し得る。消失したフレームは、デコーダによって受け取られなかったフレーム、または、デコーダによってエラーを伴って不正確に受け取られたフレームである。たとえば、フレームに対応する符号化された音声信号が受け取られない場合、またはエラーを伴って不正確に受け取られる場合、フレームは消失したフレーム(erased frame)である。
[0094] フレーム消失の例は、図5を参照して以下で与えられる。以前のフレームB 503bが消失したフレームである(たとえば、フレームn−1が失われた)と仮定する。この例では、デコーダは、失われた最終LSFベクトル(
Figure 0006356159
と表される)と中間LSFベクトル(
Figure 0006356159
と表される)とを、以前のフレームA 503a(たとえば、フレームn−2)に基づいて推定する。フレームnが正しく受け取られることも仮定する。デコーダは、
Figure 0006356159
および
Figure 0006356159
に基づいて現在のフレームの中間LSFベクトル525を計算するために、式(1)を使用することができる。
Figure 0006356159
の特定のLSF次元j(たとえば、次元j)が外挿される場合、LSF次元が、エンコーダでの外挿処理において使用されるLSF次元周波数の十分外側に置かれる(たとえば、
Figure 0006356159
)可能性がある。
[0095] 各LSFベクトル中のLSF次元は、
Figure 0006356159
となるように順序付けられてよく、ここでΔは2つの連続的なLSF次元の間の最小限の離隔(たとえば、周波数の離隔)である。上で説明されたように、あるLSF次元j(たとえば、
Figure 0006356159
と表される)が、正しい値より非常に大きくなるように誤って外挿される場合、後続のLSF次元
Figure 0006356159
は、それらがデコーダにおいて
Figure 0006356159
として計算されるとしても、
Figure 0006356159
として再計算され得る。たとえば、再計算されたLSF次元j、j+1などはLSF次元jより小さいことがあるが、それらは、課された順序付けの構造が原因で、
Figure 0006356159
となるように再計算され得る。このことは、許容される最小限の距離を伴って互いに隣り合って置かれた2つ以上のLSF次元を有するLSFベクトルを作り出す。最小限の離隔のみによって離隔された2つ以上のLSF次元は、「密集したLSF次元(clustered LSF dimensions)」と呼ばれ得る。密集したLSF次元は、不安定なLSF次元(たとえば、不安定なサブフレームLSF次元)および/または不安定なLSFベクトルをもたらし得る。不安定なLSF次元は、音声アーティファクト(speech artifact)をもたらし得る合成フィルタの係数に対応する。
[0096] 厳密には、フィルタは、単位円上に、またはその外側に少なくとも1つの極を有する場合、不安定であり得る。音声コーディングの文脈では、また、本明細書で使用される場合、「不安定な(unstable)」および「不安定性(instability)」という用語はより広い意味で使用される。たとえば、「不安定なLSF次元(unstable LSF dimension)」は、音声アーティファクトをもたらし得る合成フィルタの係数に対応する任意のLSF次元である。たとえば、不安定なLSF次元は必ずしも単位円上またはその外側にある極に対応しないことがあるが、それらが互いに過度に接近している場合は「不安定」であり得る。これは、互いに過度に接近して置かれるLSF次元は、一部の周波数において音声アーティファクトを発生させる高度に共振性のフィルタ応答を有する、合成フィルタにおける極を規定し得るからである。たとえば、不安定な量子化されたLSF次元は、望ましくないエネルギーの増大をもたらし得る、合成フィルタに対する極の配置を規定し得る。通常、LSF次元の離隔は、0とπとの間の角度に関して表されるLSF次元について、約0.01*πに保たれ得る。本明細書で使用される場合、「不安定なLSFベクトル(unstable LSF vector)」は、1つまたは複数の不安定なLSF次元を含むベクトルである。さらに、「不安定な合成フィルタ(unstable synthesis filter)」は、1つまたは複数の不安定なLSF次元に対応する1つまたは複数の係数(たとえば、極)を伴う合成フィルタである。
[0097] 図10は、密集したLSF次元1029の一例を示す図である。LSF次元はHz単位の周波数1019で示されるが、LSF次元は代替的に他の単位で特徴付けられ得ることに留意されたい。LSF次元(たとえば、
Figure 0006356159

Figure 0006356159
、および
Figure 0006356159
)は、推定および並べ替えの後の現在のフレームの中間LSFベクトルに含まれるLSF次元の例である。以前の消失したフレームでは、たとえば、デコーダは、以前のフレームの最終LSFベクトルの第1のLSF次元(たとえば、
Figure 0006356159
)を推定し、これは正しくない可能性が高い。この場合、現在のフレームの中間LSFベクトル(たとえば、
Figure 0006356159
)の第1のLSF次元も正しくない可能性が高い。
[0098] デコーダは、現在のフレームの中間LSFベクトル(たとえば、
Figure 0006356159
)の次のLSF次元を並べ替えることを試み得る。上で説明されたように、LSFベクトル中の各々の連続的なLSF次元は、以前の要素よりも大きいことが必要とされ得る。たとえば、
Figure 0006356159
1031bは、
Figure 0006356159
よりも大きくなければならない。したがって、デコーダは、
Figure 0006356159
から最小限の離隔(たとえば、Δ)を伴ってそれを配置することができる。より具体的には、
Figure 0006356159
である。したがって、図10に示されるように、最小限の離隔(たとえば、Δ=100Hz)を伴う複数のLSF次元(たとえば、
Figure 0006356159

Figure 0006356159
、および
Figure 0006356159
)があり得る。したがって、
Figure 0006356159

Figure 0006356159
、および
Figure 0006356159
は、密集したLSF次元1029の例である。密集したLSF次元は、不安定な合成フィルタをもたらすことがあり、これは次いで、合成された音声における音声アーティファクトを発生し得る。
[0099] 図11は、密集したLSF次元によるアーティファクト1135の例を示すグラフである。より具体的には、グラフは、合成フィルタに適用されている、密集したLSF次元に起因する復号された音声信号(たとえば、合成された音声)中のアーティファクト1135の例を示す。グラフの横軸は時間1101(たとえば、秒)で示され、グラフの縦軸は振幅1133(たとえば、数、値)で示される。振幅1133はビットで表される数であり得る。いくつかの構成では、16ビットが、範囲(たとえば、浮動小数点で−1と+1との間の値)に対応する、−32768と32767の間の値にわたる音声信号のサンプルを表すために利用され得る。振幅1133は、実装形態に基づいて異なるように表され得ることに留意されたい。いくつかの例では、振幅1133の値は、電圧(ボルト単位)および/または電流(アンペア単位)によって特徴付けられる電磁的信号に対応し得る。
[00100] サブフレームごとの、現在のフレームのLSFベクトルと以前のフレームのLSFベクトルとの間でのLSFベクトルの補間および/または外挿は、音声コーディングシステムにおいて知られている。図10および図11に関して説明されたような消失フレームの条件下では、LSFの補間および/または外挿の方式は、あるサブフレームに対して不安定なLSFベクトルを生成することがあり、これは、合成された音声に不快なアーティファクトをもたらし得る。このアーティファクトは、非予測的技法に加えて予測的量子化技法がLSF量子化のために使用されるときに、より頻繁に発生する。
[00101] 誤り伝播を防ぐために、誤り防止のためにより多数のビットを使用し、非予測的量子化を使用することが、その問題に対処するための一般的な方法である。しかしながら、追加のビットの導入はビットが制約されたコーダのもとでは可能ではなく、非予測的量子化の使用は、クリーンチャネルの条件(たとえば、消失したフレームを伴わない)では音声品質を下げることがある。
[00102] 本明細書で開示されるシステムおよび方法は、潜在的なフレームの不安定性を軽減するために利用され得る。たとえば、本明細書で開示されるシステムおよび方法のいくつかの構成は、欠陥のあるチャネルのもとでの予測的量子化ならびにLSFベクトルのフレーム間補間および外挿に起因するフレームの不安定性による、音声コーディングアーティファクトを軽減するために適用され得る。
[00103] 図12は、潜在的なフレームの不安定性を軽減するために構成される電子デバイス1237の一構成を示すブロック図である。電子デバイス1237は、デコーダ1208を含む。上で説明されるデコーダの1つまたは複数は、図12に関して説明されたエンコーダ1208に従って実装され得る。電子デバイス1237は消失フレーム検出器1243も含む。消失フレーム検出器1243は、デコーダ1208とは別々に実装されてよく、または、デコーダ1208において実装されてよい。消失フレーム検出器1243は、消失したフレーム(たとえば、受信されないフレームまたはエラーとともに受信されたフレーム)を検出し、消失したフレームが検出されるときに消失フレームインジケータ1267を提供することができる。たとえば、消失フレーム検出器1243は、ハッシュ関数、チェックサム、反復コード、パリティビット、巡回冗長検査(CRC)などの1つまたは複数に基づいて、消失したフレームを検出することができる。電子デバイス1237および/またはデコーダ1208に含まれるコンポーネントの1つまたは複数は、ハードウェア(たとえば、回路)、ソフトウェアまたは両方の組合せで実装され得ることに留意されたい。本明細書のブロック図において示される線または矢印の1つまたは複数は、コンポーネントまたは要素の間の結合(たとえば、接続)を示し得る。
[00104] デコーダ1208は、受け取られたパラメータに基づいて、復号された音声信号1259(たとえば、合成された音声信号)を生成する。受け取られたパラメータの例は、量子化されたLSFベクトル1282、量子化された重み付けベクトル1241、予測モードインジケータ1281、および符号化された励振信号1298を含む。デコーダ1208は、逆量子化器A 1245、補間モジュール1249、逆係数変換1253、合成フィルタ1257、フレームパラメータ決定モジュール1261、重み付け値置換モジュール1265、安定性決定モジュール1269、および逆量子化器B 1273の1つまたは複数を含む。
[00105] デコーダ1208は、量子化されたLSFベクトル1282(たとえば、量子化されたLSF、LSP、ISF、ISP、PARCOR係数、反射係数、またはログ面積比の値)と量子化された重み付けベクトル1241とを受け取る。受け取られた量子化されたLSFベクトル1282は、サブフレームのサブセットに対応し得る。たとえば、量子化されたLSFベクトル1282は、各フレームの最後のサブフレームに対応する量子化された最終LSFベクトルのみを含み得る。いくつかの構成では、量子化されたLSFベクトル1282は、参照テーブルまたはコードブックに対応するインデックスであり得る。加えて、または代替的に、量子化された重み付けベクトル1241は、参照テーブルまたはコードブックに対応するインデックスであり得る。
[00106] 電子デバイス1237および/またはデコーダ1208は、エンコーダから予測モードインジケータ1281を受け取ることができる。上で説明されたように、予測モードインジケータ1281は、各フレームの予測モードを示す。たとえば、予測モードインジケータ1281は、フレームに対して2つ以上の予測モードの1つを示し得る。より具体的には、予測モードインジケータ1281は、予測的量子化が利用されるか非予測的量子化が利用されるかを示し得る。
[00107] フレームが正しく受け取られるとき、逆量子化器A 1245は、逆量子化されたLSFベクトル1247を生成するために、受け取られた量子化されたLSFベクトル1282を逆量子化する。たとえば、逆量子化器A 1245は、参照テーブルまたはコードブックに対応するインデックス(たとえば、量子化されたLSFベクトル1282)に基づいて、逆量子化されたLSFベクトル1247を探すことができる。量子化されたLSFベクトル1282を逆量子化することは、予測モードインジケータ1281にも基づき得る。逆量子化されたLSFベクトル1247は、サブフレームのサブセット(たとえば、各フレームの最後のサブフレームに対応する最終LSFベクトル
Figure 0006356159
)に対応し得る。さらに、逆量子化器A 1245は、逆量子化された重み付けベクトル1239を生成するために、量子化された重み付けベクトル1241を逆量子化する。たとえば、逆量子化器A 1245は、参照テーブルまたはコードブックに対応するインデックス(たとえば、量子化された重み付けベクトル1241)に基づいて、逆量子化された重み付けベクトル1239を探すことができる。
[00108] フレームが消失したフレームであるとき、消失フレーム検出器1243は、消失フレームインジケータ1267を逆量子化器A 1245に提供することができる。消失したフレームが発生したとき、1つまたは複数の量子化されたLSFベクトル1282および/または1つまたは複数の量子化された重み付けベクトル1241は、受け取られていないことがあり、またはエラーを含むことがある。この場合、逆量子化器A 1245は、1つまたは複数の逆量子化されたLSFベクトル1247(たとえば、消失したフレームの最終LSFベクトル
Figure 0006356159
)を、以前のフレーム(たとえば、消失したフレームの前のフレーム)からの1つまたは複数のLSFベクトルに基づいて推定することができる。加えて、または代替的に、逆量子化器A 1245は、消失したフレームが発生したとき、1つまたは複数の逆量子化された重み付けベクトル1239を推定することができる。
[00109] 逆量子化されたLSFベクトル1247(たとえば、最終LSFベクトル)は、フレームパラメータ決定モジュール1261および補間モジュール1249に提供され得る。さらに、1つまたは複数の逆量子化された重み付けベクトル1239はフレームパラメータ決定モジュール1261に提供され得る。フレームパラメータ決定モジュール1261はフレームを取得する。たとえば、フレームパラメータ決定モジュール1261は、消失したフレーム(たとえば、消失したフレームに対応する推定された逆量子化された重み付けベクトル1239および推定された逆量子化されたLSFベクトル1247)を取得することができる。フレームパラメータ決定モジュール1261はまた、消失したフレームの後のフレーム(たとえば、正しく受信されたフレーム)を取得することができる。たとえば、フレームパラメータ決定モジュール1261は、消失したフレームの後の正しく受信されたフレームに対応する、逆量子化された重み付けベクトル1239と逆量子化されたLSFベクトル1247とを取得することができる。
[00110] フレームパラメータ決定モジュール1261は、逆量子化されたLSFベクトル1247および逆量子化された重み付けベクトル1239に基づいてフレームパラメータA 1263aを決定する。フレームパラメータA 1263aの一例は中間LSFベクトル(たとえば、
Figure 0006356159
)である。たとえば、フレームパラメータ決定モジュールは、現在のフレームの中間LSFベクトルを生成するために、受け取られた重み付けベクトル(たとえば、逆量子化された重み付けベクトル1239)を適用することができる。たとえば、フレームパラメータ決定モジュール1261は、現在のフレームの中間LSFベクトル
Figure 0006356159
を、現在のフレームの最終LSFベクトル
Figure 0006356159
、以前のフレームの最終LSFベクトル
Figure 0006356159
、および現在のフレームの重み付けベクトルwnに基づいて、式(1)に従って決定することができる。フレームパラメータA 1263aの他の例は、LSPベクトルとISPベクトルとを含む。たとえば、フレームパラメータA 1263aは、2つの最終サブフレームパラメータに基づいて推定される任意のパラメータであり得る。
[00111] いくつかの構成では、フレームパラメータ決定モジュール1261は、フレームパラメータ(たとえば、現在のフレームの中間LSFベクトル
Figure 0006356159
)が任意の並べ替えの前の規則に従って順序付けられているかどうかを決定することができる。一例では、このフレームパラメータは現在のフレームの中間LSFベクトル
Figure 0006356159
であり、その規則は、中間LSFベクトル中の各LSF次元
Figure 0006356159
が各LSF次元のペアの間に少なくとも最小限の離隔を伴う昇順であるというものであり得る。この例では、フレームパラメータ決定モジュール1261は、中間LSFベクトル中の各LSF次元
Figure 0006356159
が各LSF次元のペアの間に少なくとも最小限の離隔を伴う昇順であるかどうかを決定することができる。たとえば、フレームパラメータ決定モジュール1261は、
Figure 0006356159
が真であるかどうかを決定することができる。
[00112] いくつかの構成では、フレームパラメータ決定モジュール1261は、順序付けインジケータ1262を安定性決定モジュール1269に提供することができる。順序付けインジケータ1262は、任意の並べ替えの前に、LSF次元(たとえば、中間LSFベクトル
Figure 0006356159
の中の)の順序が乱れていたかどうか、および/またはLSF次元が最小限の離隔Δよりも大きく離隔されていなかったかどうかを示す。
[00113] フレームパラメータ決定モジュール1261は、いくつかの場合にはLSFベクトルを並べ替えることができる。たとえば、フレームパラメータ決定モジュール1261が、現在のフレームの中間LSFベクトル
Figure 0006356159
に含まれるLSF次元が昇順ではないこと、および/または、これらのLSF次元が各LSF次元のペアの間に少なくとも最小限の離隔を有さないことを決定する場合、フレームパラメータ決定モジュール1261はLSF次元を並べ替えることができる。たとえば、フレームパラメータ決定モジュール1261は、
基準
Figure 0006356159
を満たさない各LSF次元に対して
Figure 0006356159
となるように、現在のフレームの中間LSFベクトル
Figure 0006356159
中のLSF次元を並べ替えることができる。言い換えると、フレームパラメータパラメータ決定モジュール1261は、次のLSF次元が少なくともΔだけ離隔されていなかった場合、次のLSF次元の位置を取得するために、ΔをLSF次元に加えることができる。さらに、これは、最小限の離隔Δによって離隔されないLSF次元のみに対して行われ得る。上で説明されたように、この並べ替えは、中間LSFベクトル
Figure 0006356159
において密集したLSF次元をもたらし得る。したがって、フレームパラメータA 1263aは、いくつかの場合(たとえば、消失したフレームの後の1つまたは複数のフレームに対して)、並べ替えられたLSFベクトル(たとえば、中間LSFベクトル
Figure 0006356159
)であり得る。
[00114] いくつかの構成では、フレームパラメータ決定モジュール1261は、逆量子化器A 1245の一部として実装され得る。たとえば、逆量子化されたLSFベクトル1247および逆量子化された重み付けベクトル1239に基づいて中間LSFベクトルを決定することは、逆量子化手順の一部と考えられ得る。フレームパラメータA 1263aは、重み付け値置換モジュール1265に、任意選択で安定性決定モジュール1269に提供され得る。
[00115] 安定性決定モジュール1269は、フレームが潜在的に不安定かどうかを決定することができる。安定性決定モジュール1269は、現在のフレームが潜在的に不安定であると安定性決定モジュール1269が決定すると、不安定性インジケータ1271を重み付け値置換モジュール1265に提供することができる。言い換えると、不安定性インジケータ1271は、現在のフレームが潜在的に不安定であることを示す。
[00116] 潜在的に不安定なフレームは、音声アーティファクトを発生させる危険性を示す1つまたは複数の特性を伴うフレームである。音声アーティファクトを発生させる危険性を示す特性の例は、フレームが消失したフレームの後の1つまたは複数のフレーム内にあるとき、フレームと消失したフレームとの間の任意のフレームが予測的(または非予測的)量子化を利用するかどうか、および/または、フレームパラメータが任意の並べ替えの前の規則に従って順序付けられているかどうか、を含み得る。潜在的に不安定なフレームは、1つまたは複数の不安定なLSFベクトルに対応し得る(たとえば、含み得る)。潜在的に不安定なフレームはいくつかの場合には実際には安定であり得ることに留意されたい。しかしながら、フレーム全体を合成せずにフレームが確実に安定であるか確実に不安定であるかを決定するのは難しいことがある。したがって、本明細書で開示されるシステムおよび方法は、潜在的に不安定なフレームを軽減するために訂正動作を行うことができる。本明細書で開示されるシステムおよび方法の1つの利点は、フレーム全体を合成することなく、潜在的に不安定なフレームを検出することである。このことは、音声アーティファクトを検出および/または軽減するために必要とされる、処理および/またはレイテンシ(latency)の量を減らすことができる。
[00117] 第1の手法では、安定性決定モジュール1269は、現在のフレーム(たとえば、フレームn)が潜在的に不安定であるかどうかを、現在のフレームが消失したフレームの後の閾値数のフレーム内にあるかどうか、および、消失したフレームと現在のフレームとの間の任意のフレームが予測的(または非予測的)量子化を利用するかどうかに基づいて、決定する。現在のフレームは正しく受信され得る。この手法では、安定性決定モジュール1269は、現在のフレームが消失したフレームの後の閾値数のフレーム内に受信された場合、および、現在のフレームと消失したフレーム(もしあれば)との間のフレームが非予測的量子化を利用しない場合、フレームは潜在的に不安定であると決定する。
[00118] 消失したフレームと現在のフレームとの間のフレームの数は、消失フレームインジケータ1267に基づいて決定され得る。たとえば、安定性決定モジュール1269は、消失したフレームの後の各フレームに対してインクリメントするカウンタを保持し得る。一構成では、消失したフレームの後のフレームの閾値数は1であり得る。この構成では、消失したフレームの後の次のフレームは常に潜在的に不安定であると考えられる。たとえば、現在のフレームが消失したフレームの後の次のフレームである(したがって、現在のフレームと消失したフレームとの間で非予測的量子化を利用するフレームがない)場合、次いで、安定性決定モジュール1269は、現在のフレームが潜在的に不安定であると決定する。この場合、安定性決定モジュール1269は、現在のフレームが潜在的に不安定であることを示す不安定性インジケータ1271を提供する。
[00119] 他の構成では、消失したフレームの後のフレームの閾値数は1より大きいことがある。これらの構成では、安定性決定モジュール1269は、予測モードインジケータ1281に基づいて、現在のフレームと消失したフレームとの間に非予測的量子化を利用するフレームがあるかどうかを決定することができる。たとえば、予測モードインジケータ1281は、各フレームに対して予測的量子化が利用されるか非予測的量子化が利用されるかを示し得る。現在のフレームと消失したフレームとの間に非予測的量子化を使用するフレームがある場合、安定性決定モジュール1269は、現在のフレームが安定である(たとえば、潜在的に不安定ではない)と決定することができる。この場合、安定性決定モジュール1269は、現在のフレームが潜在的に不安定であることを示さなくてよい。
[00120] 第2の手法では、安定性決定モジュール1269は、現在のフレーム(たとえば、フレームn)が潜在的に不安定であるかどうかを、現在のフレームが消失したフレームの後、受信されるかどうか、フレームパラメータA 1263aが任意の並べ替えの前の規則に従って順序付けられたかどうか、および、消失したフレームと現在のフレームとの間の任意のフレームが非予測的量子化を利用するかどうかに基づいて、決定する。この手法では、安定性決定モジュール1269は、現在のフレームが消失したフレームの後、取得される場合、フレームパラメータA 1263aが任意の並べ替えの前の規則に従って順序付けられなかった場合、および、現在のフレームと消失したフレーム(もしあれば)との間のフレームが非予測的量子化を利用しない場合、フレームが潜在的に不安定であると決定する。
[00121] 現在のフレームが消失したフレームの後、受信されるかどうかは、消失フレームインジケータ1267に基づいて決定され得る。消失したフレームと現在のフレームとの間の任意のフレームが非予測的量子化を利用するかどうかは、上で説明されたような予測モードインジケータに基づいて決定され得る。たとえば、現在のフレームが消失したフレームの後の任意の数のフレームである場合、現在のフレームと消失したフレームとの間で非予測的量子化を利用するフレームがない場合、および、フレームパラメータA 1263aが任意の並べ替えの前の規則に従って順序付けられなかった場合、次いで、安定性決定モジュール1269は、現在のフレームが潜在的に不安定であると決定する。この場合、安定性決定モジュール1269は、現在のフレームが潜在的に不安定であることを示す不安定性インジケータ1271を提供する。
[00122] いくつかの構成では、安定性決定モジュール1269は、フレームパラメータ決定モジュール1261から順序付けインジケータ1262を取得することができ、これは、フレームパラメータA 1263a(たとえば、現在のフレームの中間LSFベクトル
Figure 0006356159
)が任意の並べ替えの前の規則に従って順序付けられたかどうかを示す。たとえば、順序付けインジケータ1262は、任意の並べ替えの前に、LSF次元(たとえば、中間LSFベクトル
Figure 0006356159
の中の)の順序が乱れていたかどうか、および/またはLSF次元が少なくとも最小限の離隔Δだけ離隔されていなかったかどうかを示し得る。
[00123] 第1の手法と第2の手法の組合せが、いくつかの構成では実施され得る。たとえば、第1の手法は消失したフレームの後の最初のフレームに対して適用され得るが、第2の手法は後続のフレームに対して適用され得る。この構成では、後続のフレームの1つまたは複数は、第2の手法に基づいて潜在的に不安定であるものとして示され得る。潜在的な不安定性を決定することに対する他の手法は、LSFベクトルに基づく合成フィルタのインパルス応答のエネルギー変動、および/または、LSFベクトルに基づく合成フィルタの異なる周波数帯域に対応するエネルギー変動に基づき得る。
[00124] 潜在的な不安定性が示されないとき(たとえば、現在のフレームが安定であるとき)、重み付け値置換モジュール1265は、フレームパラメータA 1263aを、フレームパラメータB 1263として補間モジュール1249に提供し、または渡す。一例では、フレームパラメータA 1263aは、
現在のフレームの最終LSFベクトル
Figure 0006356159
、以前のフレームの最終LSFベクトル
Figure 0006356159
、および受信された現在のフレームの重み付けベクトルwnに基づく、現在のフレームの中間LSFベクトル
Figure 0006356159
である。潜在的な不安定性が示されないとき、現在のフレームの中間LSFベクトル
Figure 0006356159
は安定であると見なされてよく、補間モジュール1249に提供され得る。
[00125] 現在のフレームが潜在的に不安定である場合、重み付け値置換モジュール1265は、安定なフレームパラメータ(たとえば、代わりの現在のフレームの中間LSFベクトル
Figure 0006356159
)を生成するために、代わりの重み付け値を適用する。「安定なフレームパラメータ」は、音声アーティファクトを引き起こさないパラメータである。代わりの重み付け値は、安定なフレームパラメータ(たとえば、フレームパラメータB 1263b)を確実にする所定の値であり得る。代わりの重み付け値は、(受け取られた、および/または推定された)逆量子化された重み付けベクトル1239の代わりに適用され得る。より具体的には、重み付け値置換モジュール1265は、現在のフレームが潜在的に不安定であることを不安定性インジケータ1271が示すとき、安定なフレームパラメータB 1263bを生成するために、代わりの重み付け値を逆量子化されたLSFベクトル1247に適用する。この場合、フレームパラメータA 1263aおよび/または現在のフレームの逆量子化された重み付けベクトル1239は廃棄され得る。したがって、重み付け値置換モジュール1265は、現在のフレームが潜在的に不安定であるときにフレームパラメータA 1263aを置き換えるフレームパラメータB 1263bを生成する。
[00126] たとえば、重み付け値置換モジュール1265は、(安定な)代わりの現在のフレームの中間LSFベクトル
Figure 0006356159
を生成するために、代わりの重み付け値wsubstituteを適用することができる。たとえば、重み付け値置換モジュール1265は、代わりの重み付け値を現在のフレームの最終LSFベクトルおよび以前のフレームの最終LSFベクトルに適用することができる。いくつかの構成では、代わりの重み付け値wsubstituteは、0と1との間のスカラー値であり得る。たとえば、代わりの重み付け値wsubstituteは、代わりの重み付けベクトル(たとえば、M次元を伴う)として動作することができ、ここですべての値がwsubstituteに等しく、0≦wsubstitute≦1(または0<wsubstitute<1)である。したがって、(安定な)代わりの現在のフレームの中間LSFベクトル
Figure 0006356159
は、式(3)に従って生成または決定され得る。
Figure 0006356159
0と1との間のwsubstituteを利用することは、得られた代わりの現在のフレームの中間LSFベクトル
Figure 0006356159
が、基礎となる最終LSFベクトル
Figure 0006356159
および
Figure 0006356159
が安定であれば安定となることを確実にする。この場合、代わりの現在のフレームの中間LSFベクトルは、安定なフレームパラメータの一例であり、それは、代わりの現在のフレームの中間LSFベクトルに対応する係数1255を合成フィルタ1257に適用することは、復号された音声信号1259において音声アーティファクトを引き起こさないからである。いくつかの構成では、wsubstituteは0.6として選択されてよく、これは、現在のフレームの最終LSFベクトル(たとえば、
Figure 0006356159
)に対して、消失したフレームに対応する以前のフレームの最終LSFベクトル(たとえば、
Figure 0006356159
)と比較してわずかに大きな重みを与える。
[00127] 代替的な構成では、代わりの重み付け値は、個々の重み
Figure 0006356159
を含む代わりの重み付けベクトルwsubstituteであってよく、ここでi={1,2,...,M}であり、nは現在のフレームを表す。これらの構成では、各重み
Figure 0006356159
は0と1との間にあり、すべての重みは同じではないことがある。これらの構成では、代わりの重み付け値(たとえば、代わりの重み付けベクトルwsubstitute)は式(4)で提供されるように適用され得る。
Figure 0006356159
[00128] いくつかの構成では、代わりの重み付け値は静的であり得る。他の構成では、重み付け値置換モジュール1265は、以前のフレームおよび現在のフレームに基づいて代わりの重み付け値を選択することができる。たとえば、異なる代わりの重み付け値は2つのフレーム(たとえば、以前のフレームおよび現在のフレーム)の分類(たとえば、有声(voiced)、無声(unvoiced)など)に基づいて選択され得る。加えて、または代替的に、異なる代わりの重み付け値は、2つのフレームの間の1つまたは複数のLSFの差(たとえば、LSFフィルタのインパルス応答エネルギーの差)に基づいて選択され得る。
[00129] 逆量子化されたLSFベクトル1247およびフレームパラメータB 1263bは、補間モジュール1249に提供され得る。補間モジュール1249は、サブフレームLSFベクトル(たとえば、現在のフレームに対するサブフレームLSFベクトル
Figure 0006356159
)を生成するために、逆量子化されたLSFベクトル1247とフレームパラメータB 1263bとを補間する。
[00130] 一例では、フレームパラメータB 1263は、現在のフレームの中間LSFベクトル
Figure 0006356159
であり、逆量子化されたLSFベクトル1247は、以前のフレームの最終LSFベクトル
Figure 0006356159
と現在のフレームの最終LSFベクトル
Figure 0006356159
とを含む。たとえば、補間モジュール1249は、サブフレームLSFベクトル
Figure 0006356159
を、
Figure 0006356159

Figure 0006356159
、および
Figure 0006356159
に基づいて、式
Figure 0006356159
に従って補間係数αkとβkとを使用して補間することができる。補間係数αkおよびβkは、0≦(αk,βk)≦1となるような所定の値であり得る。ここで、kは整数のサブフレーム番号であり、1≦k≦K−1であり、Kは現在のフレーム中のサブフレームの総数である。補間モジュール1249はそれに応じて、現在のフレーム中の各サブフレームに対応するLSFベクトルを補間する。いくつかの構成では、現在のフレームの最終LSFベクトル
Figure 0006356159
に対してαk=1およびβk=0である。
[00131] 補間モジュール1249は、LSFベクトル1251を逆係数変換1253に提供する。逆係数変換1253は、LSFベクトル1251を係数1255(たとえば、合成フィルタ1/A(z)に対するフィルタ係数)に変換する。係数1255は合成フィルタ1257に提供される。
[00132] 逆量子化器B 1273は、励振信号1275を生成するために符号化された励振信号1298を受け取り逆量子化する。一例では、符号化された励振信号1298は、固定コードブックインデックスと、量子化された固定コードブックゲインと、適応コードブックインデックスと、量子化された適応コードブックゲインとを含み得る。この例では、逆量子化器B 1273は、固定コードブックインデックスに基づいて固定コードブックエントリ(たとえば、ベクトル)を探し、固定コードブック寄与度を取得するために、逆量子化された固定コードブックゲインを固定コードブックエントリに適用する。加えて、逆量子化器B 1273は、適応コードブックインデックスに基づいて適応コードブックエントリを探し、適応コードブック寄与度を得るために、逆量子化された適応コードブックゲインを適応コードブックエントリに適用する。逆量子化器B 1273は次いで、励振信号1275を生成するために、固定コードブック寄与度と適応コードブック寄与度とを足すことができる。
[00133] 合成フィルタ1257は、復号された音声信号1259を生成するために、係数1255に従って励振信号1275をフィルタリングする。たとえば、合成フィルタ1257の極は、係数1255に従って構成され得る。励振信号1275は次いで、復号された音声信号1259(たとえば、合成された音声信号)を生成するために合成フィルタ1257を通される。
[00134] 図13は、潜在的なフレームの不安定性を軽減するための方法1300の一構成を示す流れ図である。電子デバイス1237は、消失フレームの後の(たとえば、時間的に後続する)フレームを取得することができる(1302)。たとえば、電子デバイス1237は、ハッシュ関数、チェックサム、反復コード、パリティビット、巡回冗長検査(CRC)などの1つまたは複数に基づいて、消失したフレームを検出することができる。電子デバイス1237は次いで、消失したフレームの後のフレームを取得することができる(1302)。取得された(1302)フレームは、消失したフレームの後の次のフレームであってよく、または、消失したフレームの後の任意の数のフレームであってよい。取得された(1302)フレームは正しく受信されたフレームであってよい。
[00135] 電子デバイス1237は、フレームが潜在的に不安定であるかどうかを決定することができる(1304)。いくつかの構成では、フレームが潜在的に不安定であるかどうかを決定すること(1304)は、フレームパラメータ(たとえば、現在のフレームの中間LSFベクトル)が任意の並べ替えの前(たとえば、もしあれば並べ替えの前)の規則に従って順序付けられているかどうかに基づく。加えて、または代替的に、フレームが潜在的に不安定であるかどうかを決定すること(1304)は、フレーム(たとえば、現在のフレーム)が消失したフレームから閾値数のフレーム内にあるかどうかに基づき得る。加えて、または代替的に、フレームが潜在的に不安定であるかどうかを決定すること(1304)は、フレーム(たとえば、現在のフレーム)と消失したフレームとの間の任意のフレームが非予測的量子化を利用するかどうかに基づき得る。
[00136] 上で説明されたような第1の手法では、電子デバイス1237は、フレームが消失したフレームの後の閾値数のフレーム内に受信される場合、および、フレームと消失したフレーム(もしあれば)との間のフレームが非予測的量子化を利用しない場合、フレームは潜在的に不安定であると決定する(1304)。上で説明されたような第2の手法では、電子デバイス1237は、現在のフレームが消失したフレームの後で取得される場合、フレームパラメータ(たとえば、現在のフレームの中間LSFベクトル
Figure 0006356159
)が任意の並べ替えの前の規則に従って順序付けられていなかった場合、および、現在のフレームと消失したフレーム(もしあれば)との間のフレームが非予測的量子化を利用しない場合、フレームは潜在的に不安定であると決定する(1304)。追加のまたは代替的な手法が使用され得る。たとえば、第1の手法は消失したフレームの後の最初のフレームに対して適用され得るが、第2の手法は後続のフレームに対して適用され得る。
[00137] 電子デバイス1237は、フレームが潜在的に不安定である場合、安定なフレームパラメータを生成するために代わりの重み付け値を適用することができる(1306)。たとえば、電子デバイス1237は、安定なフレームパラメータ(たとえば、代わりの現在のフレームの中間LSFベクトル
Figure 0006356159
)を、代わりの重み付け値を逆量子化されたLSFベクトル1247に(たとえば、現在のフレームの最終LSFベクトル
Figure 0006356159
および以前のフレームの最終LSFベクトル
Figure 0006356159
)に適用することによって、生成することができる。たとえば、安定なフレームパラメータを生成することは、現在のフレームの最終LSFベクトル(たとえば、
Figure 0006356159
)と代わりの重み付け値(たとえば、wsubstitute)との積と、以前のフレームの最終LSFベクトル(たとえば、
Figure 0006356159
)と1および代わりの重み付け値の差(たとえば、(1−wsubstitute))との積とを足したものに等しい、代わりの現在のフレームの中間LSFベクトル(たとえば、
Figure 0006356159
)を決定することを含み得る。これは、たとえば、式(3)または式(4)に示されるように行われ得る。
[00138] 図14は、潜在的なフレームの不安定性を軽減するための方法1400のより具体的な構成を示す流れ図である。電子デバイス1237は、現在のフレームを取得することができる(1402)。たとえば、電子デバイス1237は、現在のフレームに対応する時間期間に対するパラメータを取得することができる。
[00139] 電子デバイス1237は、現在のフレームが消失したフレームであるかどうかを決定することができる(1404)。たとえば、電子デバイス1237は、ハッシュ関数、チェックサム、反復コード、パリティビット、巡回冗長検査(CRC)などの1つまたは複数に基づいて、消失したフレームを検出することができる。
[00140] 現在のフレームが消失したフレームである場合、電子デバイス1237は、以前のフレームに基づいて、推定される現在のフレームの最終LSFベクトルと推定される現在のフレームの中間LSFベクトルとを取得することができる(1406)。たとえば、デコーダ1208は、消失したフレームに対してエラーコンシールメント(error concealment)を使用することができる。エラーコンシールメントでは、デコーダ1208は、以前のフレームの最終LSFベクトルと以前のフレームの中間LSFベクトルとを、推定される現在のフレームのLSFベクトルおよび推定される現在のフレームの中間LSFベクトルとしてそれぞれ複製することができる。この手順は、連続する消失したフレームのためにたどられ得る。
[00141] 2つの連続する消失したフレームの場合、たとえば、第2の消失したフレームは、第1の消失したフレームからの最終LSFベクトルの複製と、中間LSFベクトルおよびサブフレームLSFベクトルのようなすべての補間されたLSFベクトルとを含み得る。したがって、第2の消失したフレーム中のLSFベクトルは、第1の消失したフレーム中のLSFベクトルとほぼ同じであり得る。たとえば、第1の消失したフレームの最終LSFベクトルは以前のフレームから複製され得る。したがって、連続する消失したフレーム中のすべてのLSFベクトルは、最後に正しく受信されたフレームから導出され得る。最後に正しく受信されたフレームは、非常に高い安定である確率を有し得る。結果として、連続する消失したフレームが不安定なLSFベクトルを有する確率は非常に低い。これは、基本的に、連続する消失したフレームの場合には2つの類似しないLSFベクトルの間の補間がないことがあり得るからである。したがって、代わりの重み付け値は、いくつかの構成では、連続的に消失したフレームに対しては適用されないことがあり得る。
[00142] 電子デバイス1237は、現在のフレームに対するサブフレームLSFベクトルを決定することができる(1416)。たとえば、電子デバイス1237は、現在のフレームに対するサブフレームLSFベクトルを生成するために、補間係数に基づいて、現在のフレームの最終LSFベクトルと、現在のフレームの中間LSFベクトルと、以前のフレームの最終LSFベクトルとを補間することができる。いくつかの構成では、これは、式(2)に従って行われ得る。
[00143] 電子デバイス1237は、現在のフレームに対する復号された音声信号1259を合成することができる(1418)。たとえば、電子デバイス1237は、復号された音声信号1259を生成するために、サブフレームLSFベクトル1251に基づいて、係数1255によって規定される合成フィルタ1257に励振信号1275を通すことができる。
[00144] 現在のフレームが消失したフレームではない場合、電子デバイス1237は、現在のフレームの中間LSFベクトルを生成するために受け取られた重み付けベクトルを適用することができる(1408)。たとえば、電子デバイス1237は、現在のフレームの最終LSFベクトルを受け取られた重み付けベクトルと乗算することができ、以前のフレームの最終LSFベクトルを1から受け取られた重み付けベクトルを引いたものと乗算することができる。電子デバイス1237は次いで、現在のフレームの中間LSFベクトルを生成するために、得られた積を足すことができる。これは、式(1)で提供されるように行われ得る。
[00145] 電子デバイス1237は、現在のフレームが最後の消失したフレームから閾値数のフレーム内にあるかどうかを決定することができる(1410)。たとえば、電子デバイス1237は、消失フレームインジケータ1267が消失したフレームを示してから各フレームをカウントするカウンタを利用することができる。カウンタは、消失したフレームが発生するたびにリセットされ得る。電子デバイス1237は、カウンタが閾値数のフレーム内であるかどうかを決定することができる。閾値数は1つまたは複数のフレームであってよい。現在のフレームが最後の消失したフレームから閾値数のフレーム内にない場合、電子デバイス1237は、上で説明されたように、現在のフレームに対するサブフレームLSFベクトルを決定し(1416)、復号された音声信号1259を合成することができる(1418)。現在のフレームが最後の消失したフレームから閾値数のフレーム内にあるかどうかを決定すること(1410)は、不安定である確率の低いフレームに対する(たとえば、潜在的な不安定性が軽減されている1つまたは複数の潜在的に不安定なフレームの後に来るフレームに対する)不必要な処理を減らすことができる。
[00146] 現在のフレームが最後の消失したフレームから閾値数のフレーム内にある場合、電子デバイス1237は、現在のフレームと最後の消失したフレームとの間の任意のフレームが非予測的量子化を利用するかどうかを決定することができる(1412)。たとえば、電子デバイス1237は、各フレームが予測的量子化を利用するか非予測的量子化を利用するかを示す、予測モードインジケータ1281を受信することができる。電子デバイス1237は、各フレームの予測モードを追跡するために、予測モードインジケータ1281を利用することができる。現在のフレームと最後の消失したフレームとの間の任意のフレームが非予測的量子化を利用する場合、電子デバイス1237は、上で説明されたように、現在のフレームに対するサブフレームLSFベクトルを決定し(1416)、復号された音声信号1259を合成することができる(1418)。現在のフレームと最後の消失したフレームフレームとの間の任意のフレームが非予測的量子化を利用するかどうかを決定すること(1412)は、不安定である確率の低いフレームに対する(たとえば、最終LSFベクトルが任意の以前のフレームに基づいて量子化されていなかったので、正確な最終LSFベクトルを含むはずであるフレームの後に来るフレームに対する)不必要な処理を減らすことができる。
[00147] 現在のフレームと最後の消失したフレームとの間のフレームが非予測的量子化を利用しない場合(たとえば、現在のフレームの最後の消失したフレームとの間のすべてのフレームが予測的量子化を利用する場合)、電子デバイス1237は、代わりの現在のフレームの中間LSFベクトルを生成するために代わりの重み付け値を適用することができる(1414)。この場合、電子デバイス1237は、現在のフレームが潜在的に不安定であると決定することができ、安定なフレームパラメータ(たとえば、代わりの現在のフレームの中間LSFベクトル)を生成するために代わりの重み付け値を適用することができる。たとえば、電子デバイス1237は、現在のフレームの最終LSFベクトルを代わりの重み付けベクトルと乗算することができ、以前のフレームの最終LSFベクトルを1から代わりの重み付けベクトルを引いたものと乗算することができる。電子デバイス1237は次いで、代わりの現在のフレームの中間LSFベクトルを生成するために、得られた積を足すことができる。これは、式(3)または式(4)で提供されるように行われ得る。
[00148] 電子デバイス1237は次いで、上で説明されたように、現在のフレームに対するサブフレームLSFベクトルを決定することができる(1416)。たとえば、電子デバイス1237は、現在のフレームの最終LSFベクトル、以前のフレームの最終LSFベクトル、代わりの現在のフレームの中間LSFベクトル、および補間係数に基づいて、サブフレームLSFベクトルを補間することができる。これは、式(2)に従って行われ得る。電子デバイス1237はまた、上で説明されたように、復号された音声信号1259を合成することができる(1418)。たとえば、電子デバイス1237は、復号された音声信号1259を生成するために、(代わりの現在の中間LSFベクトルに基づく)サブフレームLSFベクトル1251に基づいて、係数1255によって規定される合成フィルタ1257に励振信号1275を通すことができる。
[00149] 図15は、潜在的なフレームの不安定性を軽減するための方法1500の別のより具体的な構成を示す流れ図である。電子デバイス1237は、現在のフレームを取得することができる(1502)。たとえば、電子デバイス1237は、現在のフレームに対応する時間期間に対するパラメータを取得することができる。
[00150] 電子デバイス1237は、現在のフレームが消失したフレームであるかどうかを決定することができる(1504)。たとえば、電子デバイス1237は、ハッシュ関数、チェックサム、反復コード、パリティビット、巡回冗長検査(CRC)などの1つまたは複数に基づいて、消失したフレームを検出することができる。
[00151] 現在のフレームが消失したフレームである場合、電子デバイス1237は、以前のフレームに基づいて、推定される現在のフレームの最終LSFベクトルと推定される現在のフレームの中間LSFベクトルとを取得することができる(1506)。これは、図14に関して上で説明されたように行われ得る。
[00152] 電子デバイス1237は、現在のフレームに対するサブフレームLSFベクトルを決定することができる(1516)。これは、図14に関して上で説明されたように行われ得る。電子デバイス1237は、現在のフレームに対する復号された音声信号1259を合成することができる(1518)。これは、図14に関して上で説明されたように行われ得る。
[00153] 現在のフレームが消失したフレームではない場合、電子デバイス1237は、現在のフレームの中間LSFベクトルを生成するために受け取られた重み付けベクトルを適用することができる(1508)。これは、図14に関して上で説明されたように行われ得る。
[00154] 電子デバイス1237は、現在のフレームと最後の消失したフレームとの間の任意のフレームが非予測的量子化を利用するかどうかを決定することができる(1510)。これは、図14に関して上で説明されたように行われ得る。現在のフレームと最後に消失したフレームとの間の任意のフレームが非予測的量子化を利用する場合、電子デバイス1237は、上で説明されたように、現在のフレームに対するサブフレームLSFベクトルを決定し(1516)、復号された音声信号1259を合成することができる(1518)。
[00155] 現在のフレームと最後の消失したフレームとの間のフレームが非予測的量子化を利用しない場合(たとえば、現在のフレームの最後の消失したフレームとの間のすべてのフレームが予測的量子化を利用する場合)、電子デバイス1237は、現在のフレームの中間LSFベクトルが任意の並べ替えの前の規則に従って順序付けられているかどうかを決定することができる(1512)。たとえば、電子デバイス1237は、図12に関して上で説明されたように、任意の並べ替えの前に、中間LSFベクトル
Figure 0006356159
中の各LSFが、各LSF次元のペアの間に少なくとも最小限の離隔を伴う昇順であるかどうかを決定することができる。現在のフレームの中間LSFベクトルが任意の並べ替えの前の規則に従って順序付けられている場合、電子デバイス1237は、上で説明されたように、現在のフレームに対するサブフレームLSFベクトルを決定し(1516)、復号された音声信号1259を合成することができる(1518)。
[00156] 現在のフレームの中間LSFベクトルが任意の並べ替えの前の規則に従って順序付けられていなかった場合、電子デバイス1237は、代わりの現在のフレームの中間LSFベクトルを生成するために、代わりの重み付け値を適用することができる(1514)。この場合、電子デバイス1237は、現在のフレームが潜在的に不安定であると決定することができ、安定なフレームパラメータ(たとえば、代わりの現在のフレームの中間LSFベクトル)を生成するために代わりの重み付け値を適用することができる。これは、図14に関して上で説明されたように行われ得る。
[00157] 電子デバイス1237は次いで、図14に関して上で説明されたように、現在のフレームに対するサブフレームLSFベクトルを決定し(1516)、復号された音声信号1259を合成することができる(1518)。たとえば、電子デバイス1237は、復号された音声信号1259を生成するために、(代わりの現在の中間LSFベクトルに基づく)サブフレームLSFベクトル1251に基づいて、係数1255によって規定される合成フィルタ1257に励振信号1275を通すことができる。
[00158] 図16は、潜在的なフレームの不安定性を軽減するための方法1600の別のより具体的な構成を示す流れ図である。たとえば、本明細書で開示されるシステムおよび方法のいくつかの構成は、潜在的なLSFの不安定性を検出することと、潜在的なLSFの不安定性を軽減することという、2つの手順において適用され得る。
[00159] 電子デバイス1237は、消失したフレームの後のフレームを受信することができる(1602)。たとえば、電子デバイス1237は、消失したフレームを検出し、消失したフレームの後の1つまたは複数のフレームを受信することができる。より具体的には、電子デバイス1237は、消失したフレームの後のフレームに対応するパラメータを受信することができる。
[00160] 電子デバイス1237は、現在のフレームの中間LSFベクトルが不安定である可能性があるかどうかを決定することができる。いくつかの実装形態では、電子デバイス1237は、消失したフレームの後の1つまたは複数のフレームが潜在的に不安定である(たとえば、潜在的に不安定な中間LSFベクトルを含む)と仮定し得る。
[00161] 潜在的な不安定性が検出される場合、エンコーダによって補間/外挿のために使用される受け取られた重み付けベクトルwn(たとえば、デコーダ1208にインデックスとして送信される)は廃棄され得る。たとえば、電子デバイス1237(たとえば、デコーダ1208)は、重み付けベクトルを廃棄することができる。
[00162] 電子デバイス1237は、(安定な)代わりの現在のフレームの中間LSFベクトルを生成するために、代わりの重み付け値を適用することができる(1604)。たとえば、デコーダ1208は、図12に関して上で説明されたように、代わりの重み付け値wsubstituteを適用する。
[00163] 後続のフレーム(たとえば、n+1、n+2など)が最終LSFベクトルを量子化するために予測的量子化技法を使用する場合、LSFベクトルの不安定性は伝播し得る。したがって、非予測的LSF量子化技法がフレームに対して利用されることを電子デバイス1237が決定する(1606、1614)までに受け取られた(1608)現在のフレームおよび後続のフレームに対しては、デコーダ1208は、現在のフレームの中間LSFベクトルが任意の並べ替えの前の規則に従って順序付けられているかどうかを決定することができる(1612)。より具体的には、電子デバイス1237は、現在のフレームが予測的LSF量子化を利用するかどうかを決定することができる(1606)。現在のフレームが予測的LSF量子化を利用する場合、電子デバイス1237は、新たなフレーム(たとえば、次のフレーム)が正しく受信されたかどうかを決定することができる(1608)。新たなフレームが正しく受信されなかった(たとえば、新たなフレームが消失したフレームである)場合、次いで動作は、消失したフレームの後の現在のフレームを受け取ること(1602)に進み得る。新たなフレームが正しく受信されたことを電子デバイス1237が決定する場合(1608)、電子デバイス1237は、現在のフレームの中間LSFベクトルを生成するために受け取られた重み付けベクトルを適用することができる(1610)。たとえば、電子デバイス1237は、現在のフレームの中間LSFに対して現在の重み付けベクトルを(最初はそれを置き換えることなく)使用することができる。したがって、非予測的LSF量子化技法が使用されるまでのすべての(正しく受信された)後続のフレームに対しては、デコーダは、現在のフレームの中間LSFベクトルを生成するために受け取られた重み付けベクトルを適用し(1610)、現在のフレームの中間LSFベクトルが任意の並べ替えの前の規則に従って順序付けられているかどうかを決定することができる(1612)。たとえば、電子デバイス1237は、中間LSFベクトルの補間のためにエンコーダから送信されるインデックスに基づいて、重み付けベクトルを適用することができる(1610)。次いで、電子デバイス1237は、任意の並べ替えの前に
Figure 0006356159
となるように、フレームに対応する現在のフレームの中間LSFベクトルが順序付けられているかどうかを決定することができる(1612)。
[00164] 規則の違反が検出される場合、中間LSFベクトルは潜在的に不安定である。たとえば、電子デバイス1237が、フレームに対応する中間LSFベクトルが任意の並べ替えの前の規則に従って順序付けられていないことを決定する(1612)場合、電子デバイス1237はそれに従って、中間LSFベクトル中のLSF次元が潜在的に不安定であると決定する。デコーダ1208は、上で説明されたように代わりの重み付け値を適用する(1604)ことによって、潜在的な不安定性を軽減することができる。
[00165] 現在のフレームの中間LSFベクトルが規則に従って順序付けられている場合、電子デバイス1237は、現在のフレームが予測的量子化を利用するかどうかを決定することができる(1614)。現在のフレームが予測的量子化を利用する場合、電子デバイス1237は、上で説明されたように代わりの重み付け値を適用することができる(1604)。現在のフレームが予測的量子化を利用しないこと(たとえば、現在のフレームが非予測的量子化を利用すること)を電子デバイス1237が決定する(1614)場合、電子デバイス1237は、新たなフレームが正しく受信されたかどうかを決定することができる(1616)。新たなフレームが正しく受信されない場合(たとえば、新たなフレームが消失したフレームである場合)、動作は、消失したフレームの後の現在のフレームを受け取ること(1602)に進み得る。
[00166] 現在のフレームが非予測的量子化を利用する場合、および、新たなフレームが正しく受信されたことを電子デバイス1237が決定する(1616)場合、デコーダ1208は、通常のモードの動作で使用される受け取られた重み付けベクトルを使用して、普通に動作し続ける。言い換えると、電子デバイス1237は、各々の正しく受信されたフレームに対する中間LSFベクトルの補間のためにエンコーダから送信されるインデックスに基づいて、受け取られた重み付けベクトルを適用することができる(1618)。具体的には、電子デバイス1237は、消失したフレームが発生するまで、各々の後続のフレーム(たとえば、n+nnp+1、n+nnp+2など、nnpは非予測的量子化を利用するフレームのフレーム数である)のためにエンコーダから受け取られたインデックスに基づいて、受け取られた重み付けベクトルを適用することができる(1618)。
[00167] 本明細書で開示されるシステムおよび方法は、デコーダ1208において実装され得る。いくつかの構成では、潜在的なフレームの不安定性の検出と軽減とを可能にするために、追加のビットがエンコーダからデコーダ1208に送信される必要はない。さらに、本明細書で開示されるシステムおよび方法は、クリーンチャネルの条件において品質を劣化させない。
[00168] 図17は合成された音声信号の例を示すグラフである。グラフの横軸は時間1701(たとえば、秒)で示され、グラフの縦軸は振幅1733(たとえば、数、値)で示される。振幅1733はビットで表される数であり得る。いくつかの構成では、16ビットが、範囲(たとえば、浮動小数点で−1と+1との間の値)に対応する、−32768と32767の間の値にわたる音声信号のサンプルを表すために利用され得る。振幅1733は、実装形態に基づいて異なるように表され得ることに留意されたい。いくつかの例では、振幅1733の値は、電圧(ボルト単位)および/または電流(アンペア単位)によって特徴付けられる電磁的信号に対応し得る。
[00169] 本明細書で開示されるシステムおよび方法は、図17で与えられるように合成された音声信号を生成するために実装され得る。言い換えると、図17は、本明細書で開示されるシステムおよび方法の適用に起因する、合成された音声信号の一例を示すグラフである。本明細書で開示されるシステムおよび方法を適用しない対応する波形が図11に示される。観察され得るように、本明細書で開示されるシステムおよび方法は、アーティファクトの軽減1777を提供する。言い換えると、図11に示されるアーティファクト1135が、図17に示されるように、本明細書で開示されるシステムおよび方法を適用することによって軽減または除去される。
[00170] 図18は、潜在的なフレームの不安定性を軽減するためのシステムおよび方法が実装され得るワイヤレス通信デバイス1837の一構成を示すブロック図である。図18に例示されるワイヤレス通信デバイス1837は、本明細書で説明される電子デバイスの少なくとも1つの例であり得る。ワイヤレス通信デバイス1837は、アプリケーションプロセッサ1893を含み得る。アプリケーションプロセッサ1893は一般に、ワイヤレス通信デバイス1837上の機能を実行するための命令を処理する(たとえば、プログラムを実行する)。アプリケーションプロセッサ1893は、オーディオコーダ/デコーダ(コーデック)1891に結合され得る。
[00171] オーディオコーデック(audio codec)1891は、オーディオ信号をコーディングおよび/または復号するために使用され得る。オーディオコーデック1891は、少なくとも1つのスピーカー1883、イヤピース(earpiece)1885、出力ジャック1887、および/または少なくとも1つのマイクロフォン1889に結合され得る。スピーカー1883は、電気信号または電子信号を音響信号に変換する、1つまたは複数の電気音響トランスデューサを含み得る。たとえば、スピーカー1883は、音楽を再生するため、またはスピーカーフォンの会話を出力するためなどに使用され得る。イヤピース1885は、音響信号(たとえば、音声信号)をユーザに出力するために使用され得る別のスピーカーまたは電気音響トランスデューサであり得る。たとえば、イヤピース1885は、ユーザのみが音響信号を確実に聴取できるように使用され得る。出力ジャック1887は、オーディオを出力するためのワイヤレス通信デバイス1837に、ヘッドフォンのような、他のデバイスを結合するために使用され得る。スピーカー1883、イヤピース1885および/または出力ジャック1887は、一般に、オーディオコーデック1891からオーディオ信号を出力するために使用され得る。少なくとも1つのマイクロフォン1889は、音響信号(ユーザの音声のような)を、オーディオコーデック1891に提供される電気または電子信号に変換する音響電気トランスデューサであり得る。
[00172] オーディオコーデック1891(たとえば、デコーダ)は、フレームパラメータ決定モジュール1861、安定性決定モジュール1869、および/または重み付け値置換モジュール1865を含み得る。フレームパラメータ決定モジュール1861、安定性決定モジュール1869、および/または重み付け値置換モジュール1865は、図12に関して上で説明されたように機能し得る。
[00173] アプリケーションプロセッサ1893はまた、電力管理回路1804に結合され得る。電力管理回路1804の一例は、ワイヤレス通信デバイス1837の電力消費を管理するために使用され得る電力管理集積回路(PMIC:power management integrated circuit)である。電力管理回路1804は、バッテリ1806に結合され得る。バッテリ1806は一般に、ワイヤレス通信デバイス1837に電力を提供することができる。たとえば、バッテリ1806および/または電力管理回路1804は、ワイヤレス通信デバイス1837内に含まれる要素の少なくとも1つに結合され得る。
[00174] アプリケーションプロセッサ1893は、入力を受け取るための少なくとも1つの入力デバイス1808に結合され得る。入力デバイス1808の例は、赤外線センサ、画像センサ、加速度計、タッチセンサ、キーパッドなどを含む。入力デバイス1808は、ワイヤレス通信デバイス1837とのユーザ対話を可能にし得る。アプリケーションプロセッサ1893はまた、1つまたは複数の出力デバイス1810に結合され得る。出力デバイス1810の例は、プリンター、プロジェクタ、スクリーン、触覚デバイスなどを含む。出力デバイス1810は、ワイヤレス通信デバイス1837が、ユーザにより体験され得る出力を生成することを可能にし得る。
[00175] アプリケーションプロセッサ1893は、アプリケーションメモリ1812に結合され得る。アプリケーションメモリ1812は、電子情報を記憶することが可能な任意の電子デバイスであり得る。アプリケーションメモリ1812の例は、ダブルデータレートシンクロナスダイナミックランダムアクセスメモリ(DDRAM)、シンクロナスダイナミックランダムアクセスメモリ(SDRAM)、フラッシュメモリなどを含む。アプリケーションメモリ1812は、アプリケーションプロセッサ1893のための記憶装置を提供することができる。たとえば、アプリケーションメモリ1812は、アプリケーションプロセッサ1893上で実行されるプログラムが機能するためのデータおよび/または命令を記憶し得る。
[00176] アプリケーションプロセッサ1893は、ディスプレイコントローラ1814に結合されることが可能であり、次いでディスプレイコントローラ1814は、ディスプレイ1816に結合されることが可能である。ディスプレイコントローラ1814は、ディスプレイ1816上に画像を生成するために使用されるハードウェアブロックであり得る。たとえば、ディスプレイコントローラ1814は、アプリケーションプロセッサ1893からの命令および/またはデータを、ディスプレイ1816上に提示され得る画像に変換し得る。ディスプレイ1816の例は、液晶ディスプレイ(LCD)パネル、発光ダイオード(LED)パネル、ブラウン管(CRT)ディスプレイ、プラズマディスプレイなどを含む。
[00177] アプリケーションプロセッサ1893は、ベースバンドプロセッサ1895に結合され得る。ベースバンドプロセッサ1895は、一般に、通信信号を処理する。たとえば、ベースバンドプロセッサ1895は、受け取られた信号を復調および/または復号し得る。加えて、または代替的に、ベースバンドプロセッサ1895は、送信に備えて信号を符号化および/または変調することができる。
[00178] ベースバンドプロセッサ1895は、ベースバンドメモリ1818に結合され得る。ベースバンドメモリ1818は、SDRAM、DDRAM、フラッシュメモリなどのような、電子情報を記憶することが可能な任意の電子デバイスであり得る。ベースバンドプロセッサ1895は、ベースバンドメモリ1818から情報(たとえば、命令および/もしくはデータ)を読み取ること、ならびに/またはベースバンドメモリ1818に情報を書き込むことができる。加えて、または代替的に、ベースバンドプロセッサ1895は、通信動作を実行するために、ベースバンドメモリ1818に記憶された命令および/またはデータを使用し得る。
[00179] ベースバンドプロセッサ1895は、高周波(RF)送受信機1897に結合され得る。RF送受信機1897は、電力増幅器1899と1つまたは複数のアンテナ1802に結合され得る。RF送受信機1897は、高周波信号を送信および/または受信することができる。たとえば、RF送受信機1897は、電力増幅器1899と少なくとも1つのアンテナ1802とを使用してRF信号を送信することができる。RF送受信機1897はまた、1つまたは複数のアンテナ1802を使用してRF信号を受信することができる。ワイヤレス通信デバイス1837に含まれる要素の1つまたは複数は、要素間の通信を可能にし得る一般的なバスに結合され得ることに留意されたい。
[00180] 図19は、電子デバイス1937において利用され得る様々なコンポーネントを示す。示されるコンポーネントは、同じ物理的構造物内に配置されてよく、または別個の筐体もしくは構造物中に配置されてよい。図19に関して説明される電子デバイス1937は、本明細書で説明される電子デバイスの1つまたは複数に従って実装され得る。電子デバイス1937は、プロセッサ1926を含む。プロセッサ1926は、汎用シングルマイクロプロセッサまたはマルチチップマイクロプロセッサ(たとえば、ARM)、専用マイクロプロセッサ(たとえば、デジタル信号プロセッサ(DSP))、マイクロコントローラ、プログラマブルゲートアレイなどであり得る。プロセッサ1926は、中央処理ユニット(CPU)と呼ばれ得る。単一のプロセッサ1926だけが図19の電子デバイス1937において示されているが、代替的な構成では、プロセッサの組合せ(たとえば、ARMおよびDSP)が使用され得る。
[00181] 電子デバイス1937は、プロセッサ1926と電気通信しているメモリ1920も含む。すなわち、プロセッサ1926は、メモリ1920から情報を読み取ること、および/またはメモリ1920に情報を書き込むことができる。メモリ1920は、電子情報を記憶することが可能な任意の電子コンポーネントであり得る。メモリ1920は、ランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、磁気ディスク記憶媒体、光記憶媒体、RAM中のフラッシュメモリデバイス、プロセッサとともに含まれるオンボードメモリ、プログラマブル読取り専用メモリ(PROM)、消去可能プログラマブル読取り専用メモリ(EPROM)、電気的消去可能PROM(EEPROM(登録商標))、レジスタなど、それらの組合せを含むものであってよい。
[00182] データ1924aおよび命令1922aはメモリ1920に記憶され得る。命令1922aは、1つまたは複数のプログラム、ルーチン、サブルーチン、関数、プロシージャなどを含み得る。命令1922aは、単一のコンピュータ可読ステートメントまたは多くのコンピュータ可読ステートメントを含み得る。命令1922aは、上で説明された方法、機能、および手順の1つまたは複数を実施するために、プロセッサ1926によって実行可能であり得る。命令1922aを実行することは、メモリ1920に記憶されたデータ1924aの使用を伴い得る。図19は、プロセッサ1926にロードされている(命令1922aおよびデータ1924aから来ることがある)いくつかの命令1922bとデータ1924bとを示す。
[00183] 電子デバイス1937は、他の電子デバイスと通信するための1つまたは複数の通信インターフェース1930も含み得る。通信インターフェース1930は、有線通信技術、ワイヤレス通信技術、または両方に基づき得る。様々なタイプの通信インターフェース1930の例は、シリアルポート、パラレルポート、Univeral Serial Bus(USB)、イーサネットアダプター、IEEE1394バスインターフェース、小型コンピュータシステムインターフェース(SCSI)バスインターフェース、赤外線(IR)通信ポート、Bluetooth(登録商標)ワイヤレス通信アダプターなどを含む。
[00184] 電子デバイス1937はまた、1つまたは複数の入力デバイス1932と、1つまたは複数の出力デバイス1936とを含み得る。様々な種類の入力デバイス1932の例は、キーボード、マウス、マイクロフォン、遠隔制御デバイス、ボタン、ジョイスティック、トラックボール、タッチパッド、ライトペンなどを含む。たとえば、電子デバイス1937は、音響信号を捕捉するための1つまたは複数のマイクロフォン1934を含み得る。一構成では、マイクロフォン1934は、音響信号(たとえば、声、音声)を電気信号または電子信号に変換するトランスデューサであり得る。様々な種類の出力デバイス1936の例は、スピーカー、プリンターなどを含む。たとえば、電子デバイス1937は1つまたは複数のスピーカー1938を含み得る。一構成では、スピーカー1938は、電気信号または電子信号を音響信号に変換するトランスデューサであり得る。電子デバイス1937に典型的に含まれ得る1つの特定のタイプの出力デバイスは、ディスプレイデバイス1940である。本明細書で開示される構成とともに使用されるディスプレイデバイス1940は、ブラウン管(CRT)、液晶ディスプレイ(LCD)、発光ダイオード(LED)、ガスプラズマ、エレクトロルミネセンスなどのような、任意の適切な画像投影技術を利用し得る。ディスプレイコントローラ1942はまた、メモリ1920に記憶されたデータを、ディスプレイデバイス1940上に示されるテキスト、グラフィクス、および/または(適宜)動画に変換するために提供され得る。
[00185] 電子デバイス1937の様々なコンポーネントは、電力バス、制御信号バス、ステータス信号バス、データバスなどを含み得る、1つまたは複数のバスによって一緒に結合され得る。簡単にするために、図19では様々なバスはバスシステム1928として示される。図19は、電子デバイス1937の1つの可能な構成しか示していないことに留意されたい。様々な他のアーキテクチャおよびコンポーネントが利用され得る。
[00186] 上の説明では、様々な用語に伴って参照番号が時々使用された。用語が参照番号に伴って使用されている場合、これは、図の1つまたは複数に示された特定の要素を指すことが意図され得る。用語が参照番号を伴わずに使用されている場合、これは一般に、任意の特定の図に限定されない用語を指すことが意図され得る。
[00187] 「決定すること(determining)」という用語は、多種多様な活動を包含し、したがって、「決定すること」は、計算すること、算出すること、処理すること、導出すること、調査すること、探すこと(たとえば、テーブル、データベースまたは別のデータ構造において探すこと)、確認することなどを含み得る。また、「決定すること」は、受け取ること(たとえば、情報を受け取ること)、アクセスすること(たとえば、メモリ内のデータにアクセスすること)などを含み得る。また、「決定すること」は、解決すること、選択すること、選定すること、確立することなどを含み得る。
[00188] 「に基づいて(based on)」という句は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という句は、「のみに基づいて」と「に少なくとも基づいて」の両方を表す。
[00189] 本明細書で説明される構成のいずれか1つに関して説明された特徴、機能、プロシージャ、コンポーネント、要素、構造などの1つまたは複数は、互換性のある、本明細書で説明される他の構成のいずれか1つに関して説明された機能、プロシージャ、コンポーネント、要素、構造などの1つまたは複数と組み合わせられ得ることに留意されたい。言い換えれば、本明細書で説明された機能、手順、コンポーネント、要素などの任意の互換性のある組合せは、本明細書で開示されるシステムおよび方法に従って実装され得る。
[00190] 本明細書で説明された機能は、1つまたは複数の命令としてプロセッサ可読媒体またはコンピュータ可読媒体上に記憶され得る。「コンピュータ可読媒体(computer-readable medium)」という用語は、コンピュータまたはプロセッサによってアクセスされ得る任意の利用可能な媒体を指す。限定ではなく例として、そのような媒体は、RAM、ROM、EEPROM、フラッシュメモリ、CD−ROMもしくは他の光ディスクストレージ、磁気ディスクストレージもしくは他の磁気ストレージデバイス、または、命令もしくはデータ構造の形態で所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備え得る。本明細書で使用されるディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)、およびBlu−ray(登録商標)ディスク(disc)を含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザーで光学的に再生する。コンピュータ可読媒体は、有形であり、非一時的であり得ることに留意されたい。「コンピュータプログラム製品(computer-program product)」という用語は、コンピューティングデバイスまたはプロセッサによって実行、処理または算出され得るコードまたは命令(たとえば、「プログラム」)と組み合わされたコンピューティングデバイスまたはプロセッサを指す。本明細書で使用される「コード(code)」という用語は、コンピューティングデバイスまたはプロセッサによって実行可能であるソフトウェア、命令、コードまたはデータを指すことがある。
[00191] ソフトウェアまたは命令も、伝送媒体を通じて送信され得る。たとえば、ソフトウェアが、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、次いで同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、伝送媒体の定義に含まれる。
[00192] 本明細書で開示される方法は、説明された方法を実現するための1つまたは複数のステップまたは活動を備える。方法のステップおよび/または活動は、特許請求の範囲から逸脱することなく互いに交換され得る。言い換えれば、説明された方法の適切な動作のためにステップまたは活動の特定の順序が必要とされない限り、特定のステップおよび/または活動の順序および/または使用は、特許請求の範囲を逸脱することなく修正され得る。
[00193] 特許請求の範囲は、上で示された厳密な構成およびコンポーネントに限定されないことを理解されたい。特許請求の範囲から逸脱することなく、本明細書で説明されたシステム、方法、および装置の配置構成、動作および詳細において、様々な修正、変更および変形が行われ得る。
[00194] 請求されるものは次のとおりである。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
電子デバイスによって潜在的なフレームの不安定性を軽減するための方法であって、
消失したフレームに時間的に後続するフレームを取得することと、
前記フレームが潜在的に不安定であるかどうかを決定することと、
前記フレームが潜在的に不安定である場合、安定なフレームパラメータを生成するために代わりの重み付け値を適用することと
を備える、方法。
[C2]
前記フレームパラメータが、フレームの中間線スペクトル周波数ベクトルである、C1に記載の方法。
[C3]
現在のフレームの中間線スペクトル周波数ベクトルを生成するために、受け取られた重み付けベクトルを適用することをさらに備える、C1に記載の方法。
[C4]
前記代わりの重み付け値が0と1との間にある、C1に記載の方法。
[C5]
前記安定なフレームパラメータを生成することが、前記代わりの重み付け値を、現在のフレームの最終線スペクトル周波数ベクトルおよび以前のフレームの最終線スペクトル周波数ベクトルに適用することを備える、C1に記載の方法。
[C6]
前記安定なフレームパラメータを生成することが、現在のフレームの最終線スペクトル周波数ベクトルと前記代わりの重み付け値との積と、以前のフレームの最終線スペクトル周波数ベクトルと1および前記代わりの重み付け値の差との積とを足したものに等しい、代わりの現在のフレームの中間線スペクトル周波数ベクトルを決定することを備える、C1に記載の方法。
[C7]
前記代わりの重み付け値が、2つのフレームの分類と、前記2つのフレームの間の線スペクトル周波数の差との少なくとも1つに基づいて選択される、C1に記載の方法。
[C8]
前記フレームが潜在的に不安定であるかどうかを決定することが、現在のフレームの中間線スペクトル周波数が任意の並べ替えの前の規則に従って順序付けられているかどうかに基づく、C1に記載の方法。
[C9]
前記フレームが潜在的に不安定であるかどうかを決定することが、前記フレームが前記消失したフレームの後の閾値数のフレーム内にあるかどうかに基づく、C1に記載の方法。
[C10]
前記フレームが潜在的に不安定であるかどうかを決定することが、前記フレームと前記消失したフレームとの間の任意のフレームが非予測的量子化を利用するかどうかに基づく、C1に記載の方法。
[C11]
潜在的なフレームの不安定性を軽減するための電子デバイスであって、
消失したフレームに時間的に後続するフレームを取得するフレームパラメータ決定回路と、
前記フレームパラメータ決定回路に結合される安定性決定回路と、ここにおいて、前記安定性決定回路は、前記フレームが潜在的に不安定であるかどうかを決定する、
前記安定性決定回路に結合される重み付け値置換回路と、ここにおいて、前記重み付け値置換回路は、前記フレームが潜在的に不安定である場合、安定なフレームパラメータを生成するために代わりの重み付け値を適用する、
を備える、電子デバイス。
[C12]
前記フレームパラメータが、フレームの中間線スペクトル周波数ベクトルである、C11に記載の電子デバイス。
[C13]
前記フレームパラメータ決定回路が、現在のフレームの中間線スペクトル周波数ベクトルを生成するために、受け取られた重み付けベクトルを適用する、C11に記載の電子デバイス。
[C14]
前記代わりの重み付け値が0と1との間にある、C11に記載の電子デバイス。
[C15]
前記安定なフレームパラメータを生成することが、前記代わりの重み付け値を、現在のフレームの最終線スペクトル周波数ベクトルおよび以前のフレームの最終線スペクトル周波数ベクトルに適用することを備える、C11に記載の電子デバイス。
[C16]
前記安定なフレームパラメータを生成することが、現在のフレームの最終線スペクトル周波数ベクトルと前記代わりの重み付け値との積と、以前のフレームの最終線スペクトル周波数ベクトルと1および前記代わりの重み付け値の差との積とを足したものに等しい、代わりの現在のフレームの中間線スペクトル周波数ベクトルを決定することを備える、C11に記載の電子デバイス。
[C17]
前記代わりの重み付け値が、2つのフレームの分類と、前記2つのフレームの間の線スペクトル周波数の差との少なくとも1つに基づいて選択される、C11に記載の電子デバイス。
[C18]
前記フレームが潜在的に不安定であるかどうかを決定することが、現在のフレームの中間線スペクトル周波数が任意の並べ替えの前の規則に従って順序付けられているかどうかに基づく、C11に記載の電子デバイス。
[C19]
前記フレームが潜在的に不安定であるかどうかを決定することが、前記フレームが前記消失したフレームの後の閾値数のフレーム内にあるかどうかに基づく、C11に記載の電子デバイス。
[C20]
前記フレームが潜在的に不安定であるかどうかを決定することが、前記フレームと前記消失したフレームとの間の任意のフレームが非予測的量子化を利用するかどうかに基づく、C11に記載の電子デバイス。
[C21]
命令を有する非一時的有形コンピュータ可読媒体を備える、潜在的なフレームの不安定性を軽減するためのコンピュータプログラム製品であって、前記命令が、
電子デバイスに、消失したフレームに時間的に後続するフレームを取得させるためのコードと、
前記電子デバイスに、前記フレームが潜在的に不安定かどうかを決定させるためのコードと、
前記電子デバイスに、前記フレームが潜在的に不安定である場合、安定なフレームパラメータを生成するために代わりの重み付け値を適用させるためのコードと
を備える、コンピュータプログラム製品。
[C22]
前記フレームパラメータが、フレームの中間線スペクトル周波数ベクトルである、C21に記載のコンピュータプログラム製品。
[C23]
前記電子デバイスに、現在のフレームの中間線スペクトル周波数ベクトルを生成するために、受け取られた重み付けベクトルを適用させるためのコードをさらに備える、C21に記載のコンピュータプログラム製品。
[C24]
前記代わりの重み付け値が0と1との間にある、C21に記載のコンピュータプログラム製品。
[C25]
前記安定なフレームパラメータを生成することが、前記代わりの重み付け値を、現在のフレームの最終線スペクトル周波数ベクトルおよび以前のフレームの最終線スペクトル周波数ベクトルに適用することを備える、C21に記載のコンピュータプログラム製品。
[C26]
前記安定なフレームパラメータを生成することが、現在のフレームの最終線スペクトル周波数ベクトルと前記代わりの重み付け値との積と、以前のフレームの最終線スペクトル周波数ベクトルと1および前記代わりの重み付け値の差との積とを足したものに等しい、代わりの現在のフレームの中間線スペクトル周波数ベクトルを決定することを備える、C21に記載のコンピュータプログラム製品。
[C27]
前記代わりの重み付け値が、2つのフレームの分類と、前記2つのフレームの間の線スペクトル周波数の差との少なくとも1つに基づいて選択される、C21に記載のコンピュータプログラム製品。
[C28]
前記フレームが潜在的に不安定であるかどうかを決定することが、現在のフレームの中間線スペクトル周波数が任意の並べ替えの前の規則に従って順序付けられているかどうかに基づく、C21に記載のコンピュータプログラム製品。
[C29]
前記フレームが潜在的に不安定であるかどうかを決定することが、前記フレームが前記消失したフレームの後の閾値数のフレーム内にあるかどうかに基づく、C21に記載のコンピュータプログラム製品。
[C30]
前記フレームが潜在的に不安定であるかどうかを決定することが、前記フレームと前記消失したフレームとの間の任意のフレームが非予測的量子化を利用するかどうかに基づく、C21に記載のコンピュータプログラム製品。
[C31]
潜在的なフレームの不安定性を軽減するための装置であって、
消失したフレームに時間的に後続するフレームを取得するための手段と、
前記フレームが潜在的に不安定であるかどうかを決定するための手段と、
前記フレームが潜在的に不安定である場合、安定なフレームパラメータを生成するために代わりの重み付け値を適用するための手段と
を備える、装置。
[C32]
前記フレームパラメータが、フレームの中間線スペクトル周波数ベクトルである、C31に記載の装置。
[C33]
現在のフレームの中間線スペクトル周波数ベクトルを生成するために、受け取られた重み付けベクトルを適用するための手段をさらに備える、C31に記載の装置。
[C34]
前記代わりの重み付け値が0と1との間にある、C31に記載の装置。
[C35]
前記安定なフレームパラメータを生成することが、前記代わりの重み付け値を、現在のフレームの最終線スペクトル周波数ベクトルおよび以前のフレームの最終線スペクトル周波数ベクトルに適用することを備える、C31に記載の装置。
[C36]
前記安定なフレームパラメータを生成することが、現在のフレームの最終線スペクトル周波数ベクトルと前記代わりの重み付け値との積と、以前のフレームの最終線スペクトル周波数ベクトルと1および前記代わりの重み付け値の差との積とを足したものに等しい、代わりの現在のフレームの中間線スペクトル周波数ベクトルを決定することを備える、C31に記載の装置。
[C37]
前記代わりの重み付け値が、2つのフレームの分類と、前記2つのフレームの間の線スペクトル周波数の差との少なくとも1つに基づいて選択される、C31に記載の装置。
[C38]
前記フレームが潜在的に不安定であるかどうかを決定することが、現在のフレームの中間線スペクトル周波数が任意の並べ替えの前の規則に従って順序付けられているかどうかに基づく、C31に記載の装置。
[C39]
前記フレームが潜在的に不安定であるかどうかを決定することが、前記フレームが前記消失したフレームの後の閾値数のフレーム内にあるかどうかに基づく、C31に記載の装置。
[C40]
前記フレームが潜在的に不安定であるかどうかを決定することが、前記フレームと前記消失したフレームとの間の任意のフレームが非予測的量子化を利用するかどうかに基づく、C31に記載の装置。

Claims (15)

  1. 電子デバイスによって潜在的なフレームの不安定性を軽減するための方法であって、
    消失したフレームに時間的に後続する音声信号のフレームを取得することと、
    現在のフレームの中間線スペクトル周波数ベクトルを生成するために、受信された重み付けベクトルを、現在のフレームの最終線スペクトル周波数ベクトルおよび以前のフレームの最終線スペクトル周波数ベクトルに適用することと、
    前記現在のフレームが潜在的に不安定であるかどうかを決定することと、ここにおいて、潜在的に不安定なフレームは、音声アーティファクトを発生させる危険性を示す1つまたは複数の特性を有する、
    前記現在のフレームが潜在的に不安定である場合、安定なフレームパラメータを生成するために、前記受信された重み付けベクトルの代わりに、代わりの重み付け値を適用することと、ここにおいて、前記代わりの重み付け値は0と1との間のスカラー値であり、前記安定なフレームパラメータは、サブフレーム線スペクトル周波数ベクトルの間のフレームの中間線スペクトル周波数ベクトルである、
    を備える、方法。
  2. 前記現在のフレームの中間線スペクトル周波数ベクトルに基づいて、複数のサブフレーム線スペクトル周波数ベクトルを補間することをさらに備える、請求項1に記載の方法。
  3. 前記安定なフレームパラメータを生成することが、現在のフレームの最終線スペクトル周波数ベクトルと前記代わりの重み付け値との積と、以前のフレームの最終線スペクトル周波数ベクトルと1および前記代わりの重み付け値の差との積とを足したものに等しい、代わりの現在のフレームの中間線スペクトル周波数ベクトルを決定することを備える、請求項1に記載の方法。
  4. 前記代わりの重み付け値が、2つのフレームの分類と、前記2つのフレームの間の線スペクトル周波数の差との少なくとも1つに基づいて選択される、請求項1に記載の方法。
  5. 前記現在のフレームが潜在的に不安定であるかどうかを決定することが、現在のフレームの中間線スペクトル周波数が任意の並べ替えの前の規則に従って順序付けられているかどうかに基づく、請求項1に記載の方法。
  6. 前記現在のフレームが潜在的に不安定であるかどうかを決定することが、前記現在のフレームが前記消失したフレームの後の閾値数のフレーム内にあるかどうかに基づく、請求項1に記載の方法。
  7. 前記現在のフレームが潜在的に不安定であるかどうかを決定することが、前記現在のフレームと前記消失したフレームとの間の任意のフレームが非予測的量子化を利用するかどうかに基づく、請求項1に記載の方法。
  8. 命令を記憶した潜在的なフレームの不安定性を軽減するためのコンピュータ可読記憶体であって、前記命令が、電子デバイスに請求項1乃至7のいずれかにしたがった方法を実行させるためのコード
    を備える、コンピュータ可読記憶媒体
  9. 潜在的なフレームの不安定性を軽減するための装置であって、
    消失したフレームに時間的に後続する音声信号のフレームを取得するための手段と、
    現在のフレームの中間線スペクトル周波数ベクトルを生成するために、受信された重み付けベクトルを、現在のフレームの最終線スペクトル周波数ベクトルおよび以前のフレームの最終線スペクトル周波数ベクトルに適用するための手段と、
    前記現在のフレームが潜在的に不安定であるかどうかを決定するための手段と、ここにおいて、潜在的に不安定なフレームは、音声アーティファクトを発生させる危険性を示す1つまたは複数の特性を有する、
    前記現在のフレームが潜在的に不安定である場合、安定なフレームパラメータを生成するために、前記受信された重み付けベクトルの代わりに、代わりの重み付け値を適用するための手段と、ここにおいて、前記代わりの重み付け値は0と1との間のスカラー値であり、前記安定なフレームパラメータは、サブフレーム線スペクトル周波数ベクトルの間のフレームの中間線スペクトル周波数ベクトルである、
    を備える、装置。
  10. 前記現在のフレームの中間線スペクトル周波数ベクトルに基づいて、複数のサブフレーム線スペクトル周波数ベクトルを補間するための手段さらに備える、請求項9に記載の装置。
  11. 前記安定なフレームパラメータを生成することが、現在のフレームの最終線スペクトル周波数ベクトルと前記代わりの重み付け値との積と、以前のフレームの最終線スペクトル周波数ベクトルと1および前記代わりの重み付け値の差との積とを足したものに等しい、代わりの現在のフレームの中間線スペクトル周波数ベクトルを決定することを備える、請求項9に記載の装置。
  12. 前記代わりの重み付け値が、2つのフレームの分類と、前記2つのフレームの間の線スペクトル周波数の差との少なくとも1つに基づいて選択される、請求項9に記載の装置。
  13. 前記現在のフレームが潜在的に不安定であるかどうかを決定することが、現在のフレームの中間線スペクトル周波数が任意の並べ替えの前の規則に従って順序付けられているかどうかに基づく、請求項9に記載の装置。
  14. 前記現在のフレームが潜在的に不安定であるかどうかを決定することが、前記現在のフレームが前記消失したフレームの後の閾値数のフレーム内にあるかどうかに基づく、請求項9に記載の装置。
  15. 前記現在のフレームが潜在的に不安定であるかどうかを決定することが、前記現在のフレームと前記消失したフレームとの間の任意のフレームが非予測的量子化を利用するかどうかに基づく、請求項9に記載の装置。
JP2015559227A 2013-02-21 2013-09-03 潜在的なフレームの不安定性を軽減するためのシステムおよび方法 Active JP6356159B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361767431P 2013-02-21 2013-02-21
US61/767,431 2013-02-21
US14/016,004 2013-08-30
US14/016,004 US9842598B2 (en) 2013-02-21 2013-08-30 Systems and methods for mitigating potential frame instability
PCT/US2013/057873 WO2014130087A1 (en) 2013-02-21 2013-09-03 Systems and methods for mitigating potential frame instability

Publications (3)

Publication Number Publication Date
JP2016510134A JP2016510134A (ja) 2016-04-04
JP2016510134A5 JP2016510134A5 (ja) 2016-09-29
JP6356159B2 true JP6356159B2 (ja) 2018-07-11

Family

ID=51351897

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015559227A Active JP6356159B2 (ja) 2013-02-21 2013-09-03 潜在的なフレームの不安定性を軽減するためのシステムおよび方法

Country Status (21)

Country Link
US (1) US9842598B2 (ja)
EP (1) EP2959478B1 (ja)
JP (1) JP6356159B2 (ja)
KR (1) KR101940371B1 (ja)
CN (1) CN104995674B (ja)
AU (1) AU2013378793B2 (ja)
BR (1) BR112015020133B1 (ja)
CA (1) CA2897938C (ja)
DK (1) DK2959478T3 (ja)
ES (1) ES2707888T3 (ja)
HK (1) HK1212087A1 (ja)
IL (1) IL240007B (ja)
MY (1) MY176152A (ja)
PH (1) PH12015501646B1 (ja)
RU (1) RU2644136C2 (ja)
SG (1) SG11201505415WA (ja)
SI (1) SI2959478T1 (ja)
TR (1) TR201816270T4 (ja)
TW (1) TWI520130B (ja)
UA (1) UA115350C2 (ja)
WO (1) WO2014130087A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102271462B (zh) * 2010-06-02 2015-03-11 楠梓电子股份有限公司 可辨识印刷电路板的制造方法
WO2014118156A1 (en) 2013-01-29 2014-08-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
KR102251833B1 (ko) * 2013-12-16 2021-05-13 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
RU2653458C2 (ru) * 2014-01-22 2018-05-08 Сименс Акциенгезелльшафт Цифровой измерительный вход для электрического устройства автоматизации, электрическое устройство автоматизации с цифровым измерительным входом и способ обработки цифровых входных измеренных значений
EP3869506A1 (en) 2014-03-28 2021-08-25 Samsung Electronics Co., Ltd. Method and device for quantization of linear prediction coefficient and method and device for inverse quantization
HRP20240674T1 (hr) 2014-04-17 2024-08-16 Voiceage Evs Llc Postupci, koder i dekoder za linearno prediktivno kodiranje i dekodiranje zvučnih signala pri prijelazu između okvira koji imaju različitu brzinu uzorkovanja
JP6270993B2 (ja) * 2014-05-01 2018-01-31 日本電信電話株式会社 符号化装置、及びその方法、プログラム、記録媒体
CN106486129B (zh) * 2014-06-27 2019-10-25 华为技术有限公司 一种音频编码方法和装置
US10049684B2 (en) 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection
US10510358B1 (en) * 2017-09-29 2019-12-17 Amazon Technologies, Inc. Resolution enhancement of speech signals for speech synthesis
JP7130878B2 (ja) * 2019-01-13 2022-09-05 華為技術有限公司 高分解能オーディオコーディング
US20230007095A1 (en) * 2021-07-05 2023-01-05 Huawei Technologies Co., Ltd. Methods and apparatus for communicating vector data

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59153346A (ja) 1983-02-21 1984-09-01 Nec Corp 音声符号化・復号化装置
DE69328450T2 (de) 1992-06-29 2001-01-18 Nippon Telegraph And Telephone Corp., Tokio/Tokyo Verfahren und Vorrichtung zur Sprachkodierung
US5699478A (en) 1995-03-10 1997-12-16 Lucent Technologies Inc. Frame erasure compensation technique
US5987406A (en) 1997-04-07 1999-11-16 Universite De Sherbrooke Instability eradication for analysis-by-synthesis speech codecs
US6810377B1 (en) * 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
US6456964B2 (en) * 1998-12-21 2002-09-24 Qualcomm, Incorporated Encoding of periodic speech using prototype waveforms
US7295974B1 (en) * 1999-03-12 2007-11-13 Texas Instruments Incorporated Encoding in speech compression
US6324503B1 (en) * 1999-07-19 2001-11-27 Qualcomm Incorporated Method and apparatus for providing feedback from decoder to encoder to improve performance in a predictive speech coder under frame erasure conditions
US6775649B1 (en) * 1999-09-01 2004-08-10 Texas Instruments Incorporated Concealment of frame erasures for speech transmission and storage system and method
US6574593B1 (en) * 1999-09-22 2003-06-03 Conexant Systems, Inc. Codebook tables for encoding and decoding
US6826527B1 (en) * 1999-11-23 2004-11-30 Texas Instruments Incorporated Concealment of frame erasures and method
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
US6757654B1 (en) 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
US6862567B1 (en) * 2000-08-30 2005-03-01 Mindspeed Technologies, Inc. Noise suppression in the frequency domain by adjusting gain according to voicing parameters
US7363219B2 (en) * 2000-09-22 2008-04-22 Texas Instruments Incorporated Hybrid speech coding and system
US7031926B2 (en) 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
US7478042B2 (en) * 2000-11-30 2009-01-13 Panasonic Corporation Speech decoder that detects stationary noise signal regions
DE60233283D1 (de) * 2001-02-27 2009-09-24 Texas Instruments Inc Verschleierungsverfahren bei Verlust von Sprachrahmen und Dekoder dafer
US7143032B2 (en) * 2001-08-17 2006-11-28 Broadcom Corporation Method and system for an overlap-add technique for predictive decoding based on extrapolation of speech and ringinig waveform
US20040002856A1 (en) 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US20050049853A1 (en) * 2003-09-01 2005-03-03 Mi-Suk Lee Frame loss concealment method and device for VoIP system
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7848925B2 (en) 2004-09-17 2010-12-07 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus, scalable encoding method, scalable decoding method, communication terminal apparatus, and base station apparatus
KR100612889B1 (ko) * 2005-02-05 2006-08-14 삼성전자주식회사 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
FR2897977A1 (fr) 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
EP2054876B1 (en) * 2006-08-15 2011-10-26 Broadcom Corporation Packet loss concealment for sub-band predictive coding based on extrapolation of full-band audio waveform
US7877253B2 (en) * 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
RU2421826C2 (ru) * 2006-10-13 2011-06-20 Нокиа Корпорейшн Оценка периода основного тона
KR20090076964A (ko) * 2006-11-10 2009-07-13 파나소닉 주식회사 파라미터 복호 장치, 파라미터 부호화 장치 및 파라미터 복호 방법
US8165224B2 (en) * 2007-03-22 2012-04-24 Research In Motion Limited Device and method for improved lost frame concealment
US8126707B2 (en) * 2007-04-05 2012-02-28 Texas Instruments Incorporated Method and system for speech compression
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
CA2972808C (en) * 2008-07-10 2018-12-18 Voiceage Corporation Multi-reference lpc filter quantization and inverse quantization device and method
JP5010743B2 (ja) * 2008-07-11 2012-08-29 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル傾斜で制御されたフレーミングを使用して帯域拡張データを計算するための装置及び方法
GB2466673B (en) * 2009-01-06 2012-11-07 Skype Quantization
US8428938B2 (en) * 2009-06-04 2013-04-23 Qualcomm Incorporated Systems and methods for reconstructing an erased speech frame
WO2011048117A1 (en) * 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US8990094B2 (en) 2010-09-13 2015-03-24 Qualcomm Incorporated Coding and decoding a transient frame
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
MY166394A (en) 2011-02-14 2018-06-25 Fraunhofer Ges Forschung Information signal representation using lapped transform

Also Published As

Publication number Publication date
HK1212087A1 (en) 2016-06-03
CN104995674A (zh) 2015-10-21
CA2897938C (en) 2019-05-28
IL240007B (en) 2018-06-28
EP2959478A1 (en) 2015-12-30
TWI520130B (zh) 2016-02-01
RU2015139895A (ru) 2017-03-27
KR20150119896A (ko) 2015-10-26
US20140236588A1 (en) 2014-08-21
EP2959478B1 (en) 2018-10-24
JP2016510134A (ja) 2016-04-04
CA2897938A1 (en) 2014-08-28
US9842598B2 (en) 2017-12-12
BR112015020133B1 (pt) 2021-11-30
TW201434038A (zh) 2014-09-01
CN104995674B (zh) 2018-05-18
BR112015020133A2 (pt) 2017-07-18
IL240007A0 (en) 2015-09-24
SI2959478T1 (sl) 2019-02-28
PH12015501646A1 (en) 2015-10-19
KR101940371B1 (ko) 2019-01-18
AU2013378793A1 (en) 2015-08-06
RU2644136C2 (ru) 2018-02-07
UA115350C2 (uk) 2017-10-25
DK2959478T3 (en) 2019-02-04
WO2014130087A1 (en) 2014-08-28
TR201816270T4 (tr) 2018-11-21
MY176152A (en) 2020-07-24
PH12015501646B1 (en) 2015-10-19
ES2707888T3 (es) 2019-04-05
AU2013378793B2 (en) 2019-05-16
SG11201505415WA (en) 2015-09-29

Similar Documents

Publication Publication Date Title
JP6356159B2 (ja) 潜在的なフレームの不安定性を軽減するためのシステムおよび方法
KR102007972B1 (ko) 스피치 처리를 위한 무성음/유성음 결정
JP2017161917A (ja) 平均符号化レートを制御するためのシステムおよび方法
US9208775B2 (en) Systems and methods for determining pitch pulse period signal boundaries
JP6109968B2 (ja) 補間係数セットを決定するためのシステムおよび方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160805

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160805

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180515

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180613

R150 Certificate of patent or registration of utility model

Ref document number: 6356159

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250