JP2003517157A - 位相スペクトル情報をサブサンプリングする方法および装置 - Google Patents

位相スペクトル情報をサブサンプリングする方法および装置

Info

Publication number
JP2003517157A
JP2003517157A JP2001511667A JP2001511667A JP2003517157A JP 2003517157 A JP2003517157 A JP 2003517157A JP 2001511667 A JP2001511667 A JP 2001511667A JP 2001511667 A JP2001511667 A JP 2001511667A JP 2003517157 A JP2003517157 A JP 2003517157A
Authority
JP
Japan
Prior art keywords
prototype
speech coder
phase
frame
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001511667A
Other languages
English (en)
Other versions
JP2003517157A5 (ja
JP4860859B2 (ja
Inventor
マンジュナス、シャラス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2003517157A publication Critical patent/JP2003517157A/ja
Publication of JP2003517157A5 publication Critical patent/JP2003517157A5/ja
Application granted granted Critical
Publication of JP4860859B2 publication Critical patent/JP4860859B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/097Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using prototype waveform decomposition or prototype waveform interpolative [PWI] coders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Testing Electric Properties And Detecting Electric Faults (AREA)

Abstract

(57)【要約】 位相スペクトル情報をサブサンプリングする方法および装置は、フレームのプロトタイプの位相スペクトル情報のインテリジェントサブサンプリングを使用することによりそのプロトタイプを解析し、再構成するスピーチコーダを含んでいる。プロトタイプを解析するために、スピーチコーダは基準プロトタイプの位相パラメータを生成し、現在のプロトタイプの位相パラメータを発生させ、その現在のプロトタイプの位相パラメータを多数の周波数帯域における基準プロトタイプの位相パラメータと相関させる。線形位相シフト値を使用してプロトタイプを再構成するために、スピーチコーダは基準プロトタイプの位相パラメータを生成し、そのプロトタイプに関連した1組の線形位相シフト値を発生させ、位相ベクトルを位相パラメータおよび線形位相シフト値から複数の周波数帯域にわたって構成する。円回転値を使用してプロトタイプを再構成するために、スピーチコーダはプロトタイプに関連した1組の円回転値を生成し、1組のバンドパス波形を多数の周波数帯域において発生させ、そのバンドパス波形が基準プロトタイプの位相パラメータと関連させられ、そのバンドパス波形を円回転値に基づいて修正する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は一般にスピーチ処理の分野に関し、とくにスピーチコーダによって送
信される位相スペクトル情報をサブサンプリングする方法および装置に関する。
【0002】
【従来の技術】
デジタル技術による音声の伝送は、とくに長距離およびデジタル無線電話適用
において広まってきている。このために、再構成されたスピーチの知覚される品
質を維持しながらチャンネルによって送信されることのできる最少量の情報を決
定することに関心が持たれてきている。単にサンプリングしてデジタル化するだ
けでスピーチが送信された場合、通常のアナログ電話のスピーチ品質を達成する
には64キロビット/秒(kbps)程度のデータレートが必要である。しかし
ながら、適切な符号化、伝送および受信機での再合成が後続するスピーチ解析を
使用することによってデータレートを著しく減少させることが可能である。
【0003】 スピーチを圧縮する装置は多くの通信分野で使用されている。例示的な分野
は無線通信である。無線通信の分野には、たとえば、コードレス電話、ページン
グ、無線ローカルループ、セルラーおよびPCS電話システムのような無線電話
、移動インターネットプロトコル(IP)電話、ならびに衛星通信システムを含
む多くの適用がある。とくに重用な適用は移動加入者に対する無線電話である。
【0004】 たとえば、周波数分割多重アクセス(FDMA)、時分割多重アクセス(T
DMA)および符号分割多元アクセス(CDMA)を含む無線通信システムに対
する種々の無線インターフェースが開発されている。それと接続する際に、たと
えば Advanced Mobile Phone Service(AMPS)、 Global System for Mobil
e Communications(GSM)および Interim Standard 95(IS−95)を含む
種々の国内および国際規格が制定されている。例示的な無線電話通信システムは
符号分割多元アクセス(CDMA)システムである。IS−95規格およびその
派生物であるIS95A、ANSI J−STD−008、IS−95B、提案
されている第3世代規格であるIS−95CおよびIS−2000等(ここでは
、まとめてIS−95と呼ぶ)は、セルラーまたはPCS電話通信システムに対
するCDMA無線インターフェースの使用を規定するために米国電気通信工業会
(TIA)およびその他のよく知られている規格団体により公布されている。I
S=95規格の使用にしたがって実質的に構成された例示的な無線通信システム
は、その権利が本出願人に譲渡され、ここで参考文献とされている米国特許第 5
,103,459号明細書および第 5,901,307号明細書に記載されている。
【0005】 人間の音声発生のモデルに関連のあるパラメータを抽出することによってス
ピーチを圧縮する技術を使用する装置はスピーチコーダと呼ばれている。スピー
チコーダは入ってきたスピーチ信号を時間のブロック、すなわち解析フレームに
分割する。スピーチコーダは一般にエンコーダおよびデコーダを含んでいる。エ
ンコーダは入ってきたスピーチフレームを解析してある適切なパラメータを抽出
し、その後そのパラメータを2進表示、すなわち1組のビットまたは2進データ
パケットに量子化する。そのデータパケットは通信チャンネルによって受信機お
よびデコーダに伝送される。デコーダはデータパケットを処理し、それらを量子
化される前の形態に戻してパラメータを生成し、量子化される前の形態に戻され
たパラメータを使用してスピーチフレームを再合成する。
【0006】 スピーチコーダの機能は、デジタル化されたスピーチ信号をスピーチに内在
する固有の冗長性を全て除去することによって低ビットレートの信号に圧縮する
ことである。デジタル圧縮は、入力スピーチフレームを1組のパラメータで表し
、そのパラメータを1組のビットで表すために量子化を使用することによって行
われる。入力スピーチフレームがいくつかのビットNi を有し、スピーチコーダ
により生成されたデータパケットが多数のビットNo を有している場合、スピー
チコーダによって得られる圧縮係数はCr =Ni /No である。問題は、ターゲ
ットの圧縮係数を獲得しながら、復号されたスピーチの高い音声品質を保持する
ことである。スピーチコーダの性能は(1)スピーチモデル、すなわち上述の解
析および合成処理の組合せがどの程度良好に機能するか、および(2)パラメー
タ量子化処理がNo ビット/フレームのターゲットビットレートでどの程度良好
に行われるかに依存する。したがって、スピーチモデルの目的は各フレームに対
する少ないパラメータセットによりスピーチ信号の本質、すなわちターゲット音
声品質を計算することである。
【0007】 スピーチ信号を表すのに適したパラメータセット(ベクトルを含む)の探索
はスピーチコーダの設計においておそらくもっとも重要である。良好なパラメー
タセットでは、知覚的に正確なスピーチ信号の再構成のために必要なシステム帯
域幅が低くなる。ピッチ、信号パワー、スペクトルエンベロープ(またはフォル
マント)、振幅スペクトル、および位相スペクトルはスピーチコーディングパラ
メータの例である。
【0008】 スピーチコーダは時間ドメインコーダとして構成されてもよく、この時間ド
メインコーダは、スピーチの小さい[一般に5ミリ秒(ms)のサブフレーム]
セグメントを一時に符号化するために高い時間分解能処理を使用することによっ
て時間ドメインスピーチ波形を捕捉しようとする。各サブフレームに対して、技
術的に知られている種々のサーチアルゴリズムにより、コードブックスペースか
ら高精度の標本が見出される。その代わりに、スピーチコーダは周波数ドメイン
コーダとして構成されてもよく、この周波数ドメインコーダは、1組のパラメー
タ(解析)により入力スピーチフレームの短期間のスピーチスペクトルを捕捉し
、対応した合成処理を使用してそのスペクトルパラメータからスピーチ波形を再
生しようとする。パラメータ量子化装置は、文献[ A.Gersho & R.M.Gray,Vecto
r Quantization and Signal Compression(1992) ]に記載されている既知の量子
化技術にしたがって記憶されたコードベクトル表示でパラメータを表すことによ
ってそれらを保存する。
【0009】 よく知られている時間ドメインスピーチコーダは、ここにおいて全文が参考
文献とされている文献[ L.B.Rabiner & R.W.Schafer,Digital Processing of S
peech Signals 396-453(1978) ]に記載されているコード励起線形予測(CEL
P)コーダである。CELPコーダにおいて、スピーチ信号中の短期相関すなわ
ち冗長は、短期フォルマントフィルタの係数を見出す線形予測(LP)解析によ
って除去される。短期予測フィルタを入来するスピーチフレームに適用すること
によりLP剰余信号が発生され、この信号は長期予測フィルタパラメータおよび
後続的な統計的コードブックによりさらにモデル化され、量子化される。このよ
うにして、CELPコーディングでは時間ドメインスピーチ波形を符号化するタ
スクがLP短期間フィルタ係数を符号化するタスクと、LP剰余を符号化するタ
スクとに分割される。時間ドメインコーディングは固定レートで行われる(すな
わち、各フレームに対して同数のビットNo を使用して)か、あるいは可変レー
トで行われる(異なったタイプのフレーム内容に対して異なったビットレートが
使用される)ことができる。可変レートコーダは、ターゲット品質を得るために
十分なレベルにコーデックパラメータを符号化するために必要なビット量だけを
使用することを試みる。例示的な可変レートCELPコーダは、その権利が本出
願人に譲渡され、全文がここにおいて参考文献とされている米国特許第 5,414,7
96号明細書に記載されている。
【0010】
【発明が解決しようとする課題】
CELPコーダのような時間ドメインコーダは一般に、時間ドメインスピーチ
波形の正確さを保存するためにフレーム当たりの大きいビット数No に依存する
。このようなコーダは一般に、フレーム当たりのビット数No が比較的大きい(
たとえば、8kbps以上)ならば優れた音声品質を伝送する。しかしながら、
低いビットレート(4kbps以下)では、時間ドメインのコーダは利用可能な
ビット数が制限されるため、高品質で頑強な性能を保持することができない。低
いビットレートでは、コードブックスペースが制限されるために、高レートの商
業用での開発が成功している通常の時間ドメインコーダの波形整合能力が除去さ
れる。したがって、時間的な改善にもかかわらず、低いビットレートで動作する
多くのCELPコーディングシステムは、一般に雑音として特徴付けられる知覚
的に大きい歪みの影響を受ける。
【0011】 現在、中程度から低い(すなわち、2.4乃至4kbps以下の範囲の)ビ
ットレートで動作する高品質のスピーチコーダを開発する研究への関心が高まっ
ており、また商業的にも強く必要とされている。適用分野には、無線電話、衛星
通信、インターネット電話、種々のマルチメディアおよび音声ストリーミング用
、ボイスメールならびに他の音声記憶システムが含まれる。大容量に対する必要
性と、パケット損失状況下における頑強な性能に対する要求がその推進力である
。近年における種々のスピーチコーディング標準化の努力は、低レートのスピー
チコーディングアルゴリズムの研究および開発を推し進めたもう1つの直接的な
駆動力である。低レートのスピーチコーダは許容可能な適用帯域幅当たりのチャ
ンネル、またはユーザ増加させ、適切なチャンネルコーディングの付加的な層と
結合された低レートのスピーチコーダはコーダ仕様の全体的なビット収支に適合
し、チャンネルエラー状態下において頑強な性能を得ることができる。
【0012】 スピーチを低ビットレートで効率的に符号化する1つの効果的な技術は、マ
ルチモードコーディングである。例示的なマルチモードコーディング技術は、そ
の権利が本出願人に譲渡され、全文がここにおいて参考文献とされている米国特
許出願第09/217,341号明細書(“ VARIABLE RATE SPEECH CODING”, filed Dece
mber 21,1998)に記載されている。通常のマルチモードコーダは、異なったタイ
プの入力スピーチフレームに対して異なったモード、すなわち符号化・復号アル
ゴリズムを適用する。各モード、すなわち符号化・復号処理は、たとえば有音声
スピーチ、無音声スピーチ、移行スピーチ(有音声と無音声との間の)、および
背景雑音(非スピーチ)のようなあるタイプのスピーチセグメントを最も効率的
な方法で最適に表すようにカストマイズされる。外部の開ループモード決定メカ
ニズムは入力スピーチフレームを検査し、そのフレームに適用すべきモードを決
定する。開ループモード決定は一般に、入力フレームからある数のパラメータを
抽出し、ある時間およびスペクトル特性に関してそのパラメータを評価し、モー
ド決定をその評価に基づかせることによって行われる。
【0013】 2.4kbps程度のレートで動作するコーディングシステムは一般に本質
的にパラメトリックである。すなわち、このようなコーディングシステムは、ス
ピーチ信号のピッチ周期およびスペクトルエンベロープ(またはフォルマント)
を規則的なインターバルで記述したパラメータを送信することによって動作する
。これらのいわゆるパラメトリックコーダの例はLPボコーダシステムである。
【0014】 LPボコーダは、有音声スピーチ信号をピッチ周期当りの信号パルスでモデ
ル化する。この基本的な技術は、とくにスペクトルエンベロープに関する伝送情
報を含むように増強されてもよい。LPボコーダは一般に妥当な性能を提供する
が、それらは典型的にバズとして特徴付けられる知覚的に著しい歪みを導入する
可能性がある。
【0015】 近年、波形コーダおよびパラメトリックコーダの両者のハイブリッドである
コーダが出現してきた。これらのいわゆるハイブリッドコーダの例はプロトタイ
プ波形補間(PWI)スピーチコーディングシステムである。PWIスピーチコ
ーディングシステムはまた、プロトタイプピッチ周期(PPP)スピーチコーダ
として認識されることができる。PWIスピーチコーディングシステムは有音声
スピーチをコード化する効率的な方法を提供する。PWIの基本概念は、代表的
なピッチサイクル(プロトタイプ波形)を固定インターバルで抽出し、その記述
を送信し、プロトタイプ波形間で補間を行うことによってスピーチ信号を再構成
することである。PWI方法はLP残留信号またはスピーチ信号のいずれに関し
て行われてもよい。例示的なPWIまたはPPPスピーチコーダは、本出願人に
権利が譲渡され、全文がここにおいて参考文献とされている米国特許出願第09/2
17,494号明細書(PERIODIC SPEECH CODING,filed December 21,1998 )に記載さ
れている。別のPWIまたはPPPスピーチコーダは、米国特許第 5,884,253号
明細書および文献[ W.Bastiaan Kleijn & Wolfgang Granzow“ Methods for Wav
eform Interpolation in Speech Coding, ”in 1 Digital Signal Processing 2
15-230(1991)] に記載されている。
【0016】 多くの通常のスピーチコーダでは、所定のピッチプロトタイプの位相パラメ
ータはエンコーダによってそれぞれ個々に量子化されて送信される。その代わり
、位相パラメータは、帯域幅を保存するために量子化されたベクトルであっても
よい。しかしながら、低ビットレートのスピーチコーダでは、満足できる音声品
質を維持するために可能な最少数のビットを送信することが有効である。このた
めに、いくつかの通常のスピーチコーダにおいて、位相パラメータはエンコーダ
により全く送信されない可能性があり、またそのデコーダは再構成のために位相
を使用しないか、あるいはある固定され、記憶された位相パラメータセットを使
用する可能性がある。いずれの場合も、結果的に得られる音声品質は低下する可
能性がある。したがって、位相スペクトル情報をエンコーダからデコーダに送信
するために必要なエレメントの数を減少させ、それによって送信される位相情報
を減少させる低ビットレートのスピーチコーダを提供することが望ましい。した
がって、送信されるフレーム当たりの位相パラメータが減少されたスピーチコー
ダが必要とされている。
【0017】
【課題を解決するための手段】
本発明は、送信されるフレーム当たりの位相パラメータが減少されたスピーチ
コーダに関する。したがって、本発明の1つの特徴において、スピーチコーダに
おいてフレームのプロトタイプを処理する方法は、基準プロトタイプの複数の位
相パラメータを生成し、プロトタイプの複数の位相パラメータを発生させ、プロ
トタイプの位相パラメータを基準プロトタイプの位相パラメータと複数の周波数
帯域において相関させるステップを有効に含んでいる。
【0018】 本発明の別の特徴において、スピーチコーダにおいてフレームのプロトタイ
プを処理する方法は、基準プロトタイプの複数の位相パラメータを生成し、プロ
トタイプに関連した複数の線形位相シフト値を発生させ、その位相パラメータと
その線形位相シフト値から位相ベクトルを複数の周波数帯域にわたって形成する
ステップを有効に含んでいる。
【0019】 本発明のさらに別の特徴において、スピーチコーダにおいてフレームのプロ
トタイプを処理する方法は、プロトタイプに関連した複数の円回転値を生成し、
複数のバンドパス波形を複数の周波数帯域で発生させ、その複数のバンドパス波
形が基準プロトタイプの複数の位相パラメータと関連させられ、複数のバンドパ
ス波形を複数の円回転値に基づいて修正するステップを有効に含んでいる。
【0020】 本発明の別の特徴において、スピーチコーダは、フレームの基準プロトタイ
プの複数の位相パラメータを生成する手段と、現在のフレームの現在のプロトタ
イプの複数の位相パラメータを発生させる手段と、現在のプロトタイプの位相パ
ラメータを基準プロトタイプの位相パラメータと複数の周波数帯域において相関
させる手段とを有効に備えている。
【0021】 本発明のさらに別の特徴において、スピーチコーダは、フレームの基準プロ
トタイプの複数の位相パラメータを生成する手段と、現在のフレームの現在のプ
ロトタイプに関連した複数の線形位相シフト値を発生させる手段と、位相パラメ
ータと線形位相シフト値から位相ベクトルを複数の周波数帯域にわたって形成す
る手段とを有効に備えている。
【0022】 本発明の別の特徴において、スピーチコーダは、現在のフレームの現在のプ
ロトタイプに関連した複数の円回転値を生成する手段と、フレームの基準プロト
タイプの複数の位相パラメータと関連した複数のバンドパス波形を複数の周波数
帯域で発生させる手段と、複数のバンドパス波形を複数の円回転値に基づいて修
正する手段とを有効に備えている。
【0023】 本発明の別の特徴において、スピーチコーダは、スピーチコーダによって処
理されている現在のフレームから現在のプロトタイプを抽出するように構成され
たプロトタイプ抽出装置と、プロトタイプ抽出装置に結合されており、フレーム
の基準プロトタイプの複数の位相パラメータを生成し、現在のプロトタイプの複
数の位相パラメータを発生させ、現在のプロトタイプの位相パラメータを基準プ
ロトタイプの位相パラメータと複数の周波数帯域において相関させるように構成
されたプロトタイプ量子化装置とを有効に備えている。
【0024】 本発明のさらに別の特徴において、スピーチコーダは、スピーチコーダによ
って処理されている現在のフレームから現在のプロトタイプを抽出するように構
成されたプロトタイプ抽出装置と、プロトタイプ抽出装置に結合されており、フ
レームの基準プロトタイプの複数の位相パラメータを生成し、現在のプロトタイ
プに関連した複数の線形位相シフト値を発生させ、その位相パラメータとその線
形位相シフト値から位相ベクトルを複数の周波数帯域にわたって構成するように
構成されたプロトタイプ量子化装置とを有効に備えている。
【0025】 本発明の別の特徴において、スピーチコーダは、スピーチコーダによって処
理されている現在のフレームから現在のプロトタイプを抽出するように構成され
たプロトタイプ抽出装置と、プロトタイプ抽出装置に結合されており、現在のプ
ロトタイプに関連した複数の円回転値を生成し、フレームの基準プロトタイプの
複数の位相パラメータに関連している複数のバンドパス波形を発生させ、複数の
円回転値に基づいて複数のバンドパス波形を修正するように構成されたプロトタ
イプ量子化装置とを有効に備えている。
【0026】
【発明の実施の形態】
以下に説明する例示的な実施形態は、CDMA無線インターフェースを使用す
るように構成された無線電話通信システムに属する。しかしながら、当業者は、
本発明の特徴を使用するサブサンプリング方法および装置が当業者に知られてい
る広範囲のテクノロジーを使用する種々の通信システムの任意のもので実施する
ことが可能なことを認識するであろう。 図1に示されているように、CDMA無線電話システムは一般に、複数の移動
加入者装置10と、複数の基地局12と、基地局制御装置(BSC)14と、および移
動装置交換局(MSC)16とを含んでいる。MSC16は、通常の公衆交換電話網
(PSTN)18とインターフェースするように構成されている。MSC16はまた
BSC14とインターフェースするように構成されている。BSC14はバックホー
ルラインによって基地局12に結合されている。バックホールラインは、たとえば
、E1/T1、ATM、IP、PPP、フレームリレー、HDSL、ADSL、
またはxDSL等を含むいくつかの既知のインターフェースの任意のものをサポ
ートするように構成されている。2以上のBSC14がそのシステム内に存在して
いてもよいことが認識される。各基地局12は、無指向性アンテナまたは基地局12
から半径方向の特定の方向に向けられたアンテナをそれぞれ含んでいる1以上の
セクタ(示されていない)を含んでいることが有効である。その代わりに、各セ
クタは2個のダイバーシティ受信用アンテナを備えていてもよい。各基地局12は
、複数の周波数割当てをサポートするように都合よく設計されることができる。
セクタと周波数割当ての交差点をCDMAチャンネルと呼ぶことができる。基地
局12はまた基地局トランシーバサブシステム(BTS)12として知られている。
その代わりに“基地局”はBSC14および1以上のBTS12をまとめて呼ぶため
に工業的に使用されてもよい。BTS12はまた“セルサイト”12と呼ばれること
もある。その代わりに、所定のBTS12の個々のセクタはセルサイトと呼ばれて
もよい。移動加入者装置10は一般に、セルラーまたはPCS電話機10である。そ
のシステムは、IS−95規格にしたがって使用されるように構成されるのがよ
い。
【0027】 セルラー電話システムの一般的な動作中、基地局12は移動装置10のセットか
ら逆方向リンク信号のセットを受信する。移動装置10は電話呼またはその他の通
信を処理する。所定の基地局12によって受信された各逆方向リンク信号は、基地
局12内で処理される。結果的に得られたデータはBSC14に転送される。BSC
14は、基地局12間におけるソフトハンドオフの編成を含む呼リソース割当ておよ
び移動性管理機能を行う。BSC14はまた受信されたデータをMSC16に導き、
そのMSC16はPSTN18とのインターフェース用の付加的な経路設定サービス
を行う。同様に、PSTN18はMSC16とインターフェースし、MSC16はBS
C14とインターフェースし、このBSC14が基地局12を制御して順方向リンク信
号のセットを移動装置10のセットに送信する。
【0028】 図2に示されているように、第1のエンコーダ100 はデジタル化されたスピ
ーチサンプルs(n)を受取り、伝送媒体102 すなわち通信チャンネル102 によ
り第1のデコーダ104 に送信するためにそのサンプルを符号化する。デコーダ10
4 は符号化されたスピーチサンプルを復号し、出力スピーチ信号sSYNTH (n)
を合成する。逆方向に送信するために第2のエンコーダ106 がデジタル化された
スピーチサンプルs(n)を符号化し、それが通信チャンネル108 で送信される
。第2のデコーダ110 はその符号化されたスピーチサンプルを受取って復号し、
合成された出力スピーチ信号sSYNTH (n)を発生させる。
【0029】 スピーチサンプルs(n)は、たとえば、パルス符号変調(PCM)、圧伸
μ法則またはA法則を含む技術的に知られている種々の方式の任意のものにした
がってデジタル化されて量子化されたスピーチ信号を意味する。技術的に知られ
ているように、スピーチサンプルs(n)は、各フレームが予め定められた数の
デジタル化されたスピーチサンプルs(n)を含む入力データのフレームに構成
される。例示的な実施形態において、160個のサンプルを含む20m秒のフレ
ームによって8kHzのサンプリングレートが使用される。以下に説明する実施
形態において、データ伝送レートは13.2kbps(フルレート)から6.2
kbps(1/2レート)、2.6bps(1/4レート)、1bps(1/8
レート)にフレーム単位で都合よく変更されてもよい。データ伝送レートの変更
は有効である。それは、比較的少量のスピーチ情報を含むフレームに対して低い
ビットレートを選択的に使用することができるからである。当業者によって認識
されるように、別のサンプリングレート、フレームサイズおよびデータ伝送レー
トを使用することができる。
【0030】 第1のエンコーダ100 と第2のデコーダ110 は第1のスピーチコーダ、すな
わちスピーチコーデックを構成している。スピーチコーダは、スピーチ信号を送
信するために、たとえば図1を参照して上述した加入者装置、BTS、またはB
SCを含む任意の通信装置において使用されることができる。同様に第2のエン
コーダ106 と第1のデコーダ104 は第2のスピーチコーダを構成している。当業
者によって認識されるように、スピーチコーダはデジタル信号プロセッサ(DS
P)、特定用途向け集積回路(ASIC)、離散型ゲート論理装置、ファームウ
ェア、あるいは任意の通常のプログラム可能なソフトウェアモジュールおよびマ
イクロプロセッサにより構成されてもよい。ソフトウェアモジュールは、RAM
メモリ、フラッシュメモリ、レジスタまたはその他の任意の形態の技術的に知ら
れている記憶媒体であることができる。その代わりに、任意の通常のプロセッサ
、制御装置または状態マシンがマイクロプロセッサの代わりに使用されることが
できる。スピーチコーディングのためにとくに設計された例示的なASICは、
それらの権利が本出願人に譲渡され、全文がここにおいて参考文献とされている
米国特許第 5,727,123号明細書および米国特許出願第08/197,417号明細書(“VO
CODER ASIC”,filed February 16 1994 )に記載されている。
【0031】 図3において、スピーチコーダにおいて使用されることのできるエンコーダ2
00 は、モード決定モジュール202 と、ピッチ評価モジュール204 と、LP解析
モジュール206 と、LP解析フィルタ208 と、LP量子化モジュール210 と、お
よび剰余量子化モジュール212 とを備えている。入力スピーチフレームs(n)
はモード決定モジュール202 、ピッチ評価モジュール204 、LP解析モジュール
206 、およびLP解析フィルタ208 に供給される。モード決定モジュール202 は
、各入力スピーチフレームs(n)の特徴である周期性、エネルギ、信号対雑音
比(SNR)、またはゼロ交差レートにとくに基づいてモード指標IM およびモ
ードMを生成する。周期性にしたがってスピーチフレームを分類する種々の方法
は、その権利が本出願人に譲渡され、全文がここにおいて参考文献とされている
米国特許第 5,911,128号明細書に記載されている。このような方法はまた米国電
気通信工業会の工業暫定規格TIA/EIA IS−127およびTIA/EI
A IS−733に含まれている。例示的なモード決定方式はまた、上述の米国
特許出願第09/217,341号明細書に記載されている。
【0032】 ピッチ評価モジュール204 は、各入力スピーチフレームs(n)に基づいて
ピッチ指標IP および遅延値P0 を生成する。LP解析モジュール206 は各入力
スピーチフレームs(n)に関して線形予測解析を行ってLPパラメータaを発
生させる。LPパラメータaはLP量子化モジュール210 に供給される。LP量
子化モジュール210 はまたモードMを受取り、それによって量子化処理をモード
依存方式で行う。LP量子化モジュール210 はLP指標ILPおよび量子化された
LPパラメータ:
【数1】 を生成する。LP解析フィルタ208 は入力スピーチフレームs(n)に加えて、
量子化されたLPパラメータ^aを受取る。LP解析フィルタ208 はLP剰余信
号R[n]を発生し、これは入力スピーチフレームs(n)と量子化された線形
予測されたパラメータ^aに基づいて再構成されたスピーチとの間のエラーを表
す。LP剰余信号R[n]、モードMおよび量子化されたLPパラメータ^aは
剰余量子化モジュール212 に供給される。これらの値に基づいて、剰余量子化モ
ジュール212 は剰余指標IR および量子化された剰余信号^R[n]を生成する
【0033】 図4において、スピーチコーダにおいて使用されることのできるデコーダ300 はLPパラメータデコードモジュール302 と、剰余デコードモジュール304 と
、モードデコードモジュール306 と、およびLP合成フィルタ308 とを含んでい
る。モードデコードモジュール306 はモード指標IM を受取って復号し、モード
Mをそこから発生させる。LPパラメータデコードモジュール302 はモードMと
LP指標ILPを受取る。LPパラメータデコードモジュール302 は受取った値を
復号して、量子化されたLPパラメータ^aを生成する。剰余デコードモジュー
ル304 は剰余指標IR と、ピッチ指標I Pと、およびモード指標I Mとを受取る
。剰余デコードモジュール304 は受取った値を復号して、量子化された剰余信号
^R[n]を発生させる。量子化された剰余信号^R[n]および量子化された
LPパラメータ^aはLP合成フィルタ308 に供給され、このLP合成フィルタ
308 が復号された出力スピーチ信号^s[n]をこれらから合成する。
【0034】 図3のエンコーダ300 および図4のデコーダ400 の種々のモジュールの動作
および構成は技術的に知られており、上述した米国特許第 5,414,796号明細書お
よび文献[L.B.Rabiner & R.W.Schafer,Digital Processing of Speech Signal,3
96-453(1978)] に記載されている。
【0035】 図5のフローチャートに示されているように、1実施形態によるスピーチコ
ーダは、スピーチサンプルを送信のために処理するときに1組のステップを行う
。ステップ400 において、スピーチコーダはスピーチ信号のデジタルサンプルを
連続したフレームで受取る。スピーチコーダは所定のフレームを受信することに
よってステップ402 に進む。ステップ402 において、スピーチコーダはそのフレ
ームのエネルギを検出する。エネルギはフレームのスピーチアクティビティの尺
度である。スピーチ検出はデジタル化されたスピーチサンプルの振幅の2乗を合
計し、結果的に得られたエネルギをしきい値と比較することによって行われる。
1実施形態では、しきい値は変化している背景雑音レベルに基づいて適合される
。例示的な可変しきい値スピーチ活動検出器は、上述の米国特許第 5,414,796号
明細書に記載されている。ある無音声スピーチ音は、誤って背景雑音として符号
化される可能性のある著しく低いエネルギのサンプルである可能性が高い。これ
が発生しないようにするために、上述の米国特許第 5,414,796号明細書に記載さ
れているように、無音声スピーチを背景雑音から弁別するために低エネルギサン
プルのスペクトル傾斜が使用されてもよい。
【0036】 フレームのエネルギを検出した後、スピーチコーダはステップ404 に進む。
ステップ404 において、スピーチコーダは、検出されたフレームがスピーチ情報
を含むものとしてフレームを分類するのに十分なエネルギを有しているか否かを
決定する。検出されたフレームのエネルギが予め定められたしきい値レベルより
低い場合、スピーチコーダはステップ406 に進む。ステップ406 において、スピ
ーチコーダはフレームを背景雑音(すなわち。非スピーチ、または沈黙)として
符号化する。1実施形態では、背景雑音フレームは1/8レートすなわち1kb
psで符号化される。ステップ404 において、検出されたフレームのエネルギが
予め定められたしきい値レベル以上である場合、そのフレームはスピーチとして
分類され、スピーチコーダはステップ408 に進む。
【0037】 ステップ408 において、スピーチコーダは、そのフレームが無音声スピーチ
であるかどうかを決定する。すなわち、スピーチコーダはそのフレームの周期性
を検査する。種々の既知の周期性決定方法には、たとえば、ゼロ交差の使用およ
び正規化された自己相関関数(NACF)の使用が含まれている。とくにゼロ交
差およびNACFを使用した周期性の検出は、米国特許第 5,911,128号明細書お
よび米国特許出願第09/217,341号明細書に記載されている。さらに、有音声スピ
ーチを無音声スピーチから弁別するために使用されている上記の方法は、米国電
気通信工業会の暫定規格TIA/EIA IS−127およびTIA/EIA
IS−733に含まれている。ステップ408 においてフレームが無音声スピーチ
であると決定された場合、スピーチコーダはステップ410 に進む。ステップ410
において、スピーチコーダはフレームを無音声スピーチとして符号化する。1実
施形態において、無音声スピーチフレームは1/4レートすなわち2.6kbp
sで符号化される。ステップ408 においてフレームが無音声スピーチではないと
決定された場合、スピーチコーダはステップ412 に進む。
【0038】 ステップ412 において、スピーチコーダは、たとえば上記の米国特許第 5,91
1,128号明細書に記載されているような、技術的に知られている周期性決定方法
を使用して、そのフレームが移行スピーチであるかどうかを決定する。そのフレ
ームが移行スピーチであると決定された場合、スピーチコーダはステップ414 に
進む。ステップ414 において、フレームは移行スピーチ(すなわち、無音声スピ
ーチから有音声スピーチへの移行)として符号化される。1実施形態では、移行
スピーチフレームは、本出願人にその権利が譲渡され、ここにおいて全文が参考
文献とされている米国特許出願第09/307,294号明細書(MULTIPULSE INTERPOLATI
VE CODING OF TRANSITION SPEECH FRAMES,filed May 7,1999)に記載されている
マルチパルス補間符号化方法にしたがって符号化される。別の実施形態では、移
行スピーチフレームはフルレート、すなわち13.2kbpsで符号化される。
【0039】 スピーチコーダは、ステップ412 においてフレームは移行スピーチではない
と決定した場合、そのフレームを有音声スピーチとして符号化する。1実施形態
において、有音声スピーチフレームは1/2レート、すなわち6.2kbpsで
符号化されることができる。有音声スピーチフレームはフルレート、すなわち1
3.2kbpsで(8kのCELPコーダではフルレート、すなわち8kbps
で)符号化されることもできる。しかしながら、当業者に認識されるように、1
/2レートで有音声フレームを符号化することにより、コーダは有音声フレーム
の定常状態の性質を利用することにより貴重な帯域幅を節約することが可能にな
る。さらに、有音声スピーチを符号化するために使用されるレートと関係なく、
有音声スピーチは過去のフレームからの情報を使用して有効にコード化され、し
たがって、予測的に符号化されると言える。
【0040】 当業者は、スピーチ信号または対応したLP剰余のいずれも図5に示されて
いるステップを行うことによって符号化されることができることを認識するであ
ろう。雑音、無音声、移行および有音声スピーチの波形特性は、図6のAのグラ
フにおいて時間の関数として示されている。雑音、無音声、移行および有音声L
P剰余の波形特性は、図6のBのグラフにおいて時間の関数として示されている
【0041】 1実施形態において、プロトタイプピッチ周期(PPP)スピーチコーダ500
は図7に示されているように反転フィルタ502 と、プロトタイプ抽出装置504
と、プロトタイプ量子化装置506 と、プロトタイプの量子化から復元する装置50
8 と、補間/合成モジュール510 と、LPC合成モジュール512 とを備えている
。スピーチコーダ500 はDSPの一部分として構成されると都合がよく、また、
たとえばPCSまたはセルラー電話システムにおける加入者装置または基地局内
、あるいは衛星システムにおける加入者装置またはゲートウェイ内等に設けられ
てもよい。
【0042】 スピーチコーダ500 において、nをフレーム数としてデジタル化されたスピ
ーチ信号s(n)は、反転LPフィルタ502 に供給される。特定の実施形態では
、フレーム長は20m秒である。反転フィルタの伝達関数A(z)は以下の式に
したがって計算される: A(z)=1−a1 -1−a2 -2−…−ap -p, ここで、係数aI は、ここにおいて共に参考文献とされている米国特許第 5,414
,796号明細書および米国特許出願第09/217,494号明細書に記載されているように
既知の方法にしたがって選択された予め定められた値を有するフィルタタップで
ある。数pは、反転LPフィルタ502 が予測のために使用している前のサンプル
の数を示す。特定の実施形態において、pは10に設定されている。
【0043】 反転フィルタ502 はLP剰余信号r(n)をプロトタイプ抽出装置504 に供
給する。プロトタイプ抽出装置504 はプロトタイプを現在のフレームから抽出す
る。このプロトタイプは、デコーダにおいてLP剰余信号を再構成するためにフ
レーム内に同様に位置された前のフレームからのプロトタイプが補間/合成モジ
ュール510 により線形的に補間される現在のフレームの一部分である。
【0044】 プロトタイプ抽出装置504 はプロトタイプをプロトタイプ量子化装置506 に
供給し、このプロトタイプ量子化装置506 は図8を参照して以下に説明される技
術にしたがってプロトタイプを量子化する。量子化された値は、ルックアップテ
ーブル(示されていない)から得られてもよく、チャンネルによって送信するた
めの遅延およびその他のコードブックパラメータを含むパケットに組立てられる
。パケットは送信機(示されていない)に供給され、チャンネルによって受信機
(示されていない)に送信される。反転LPフィルタ502 、プロトタイプ抽出装
置504 およびプロトタイプ量子化装置506 は現在のフレームに関するPPP解析
を行われたと言われる。
【0045】 受信機はパケットを受信し、そのパケットをプロトタイプ量子化装置508 に
供給する。このプロトタイプ量子化装置508 は、図9を参照して以下に説明され
る技術にしたがってパケットを量子化される前の状態に戻す。プロトタイプ量子
化装置508 は、量子化される前の状態に戻されたプロトタイプを補間/合成モジ
ュール510 に供給する。補間/合成モジュール510 は、現在のフレームのために
LP剰余信号を再構成するためにフレーム内に同様に位置された前のフレームか
らのプロトタイプをプロトタイプに補間する。補間およびフレーム合成は、米国
特許第 5,884,253号明細書および上述された米国特許出願第09/217,494号明細書
に記載されている既知の方法にしたがって都合よく行われる。
【0046】 補間/合成モジュール510 は、再構成されたLP剰余信号^r(n)をLP
C合成モジュール512 に供給する。LPC合成モジュール512 はまた送信された
パケットから線形スペクトル対(LSP)値を受取り、これらの値は再構成され
たLP剰余信号^r(n)についてLPCフィルタ処理を行って再構成されたス
ピーチ信号^s(n)を生成するために使用される。別の実施形態では、スピー
チ信号^s(n)のLPC合成は、現在のフレームの補間/合成を行う前にプロ
トタイプに対して行われてもよい。プロトタイプ量子化復元装置508 、補間/合
成モジュール510 およびLPC合成モジュール512 は現在のフレームのPPP解
析を行われたと言われる。
【0047】 1実施形態において、プロトタイプ量子化装置600 は、図8に示されている
効率的な送信のためにインテリジェントサブサンプリングを使用してプロトタイ
プフェーズの量子化を行う。プロトタイプ量子化装置600 は、第1および第2の
離散フーリエ級数(DFS)係数計算モジュール602 、604 、第1および第2の
分解モジュール606 、608 、帯域識別モジュール610 、振幅ベクトル量子化装置
612 、相関モジュール614 ならびに量子化装置616 を含んでいる。
【0048】 プロトタイプ量子化装置600 において、基準プロトタイプが第1のDFS係
数計算モジュール602 に供給される。この第1のDFS係数計算モジュール602
は、以下説明するように基準プロトタイプに対するDFS係数を計算し、基準プ
ロトタイプに対するDFS係数を第1の分解モジュール606 に供給する。この第
1の分解モジュール606 は、以下説明するように基準プロトタイプに対するDF
S係数を振幅および位相ベクトルに分解する。第1の分解モジュール606 は、そ
の振幅および位相ベクトルを相関モジュール614 に供給する。
【0049】 現在のプロトタイプは、第2のDFS係数計算モジュール604 に供給される
。この第2のDFS係数計算モジュール604 は、以下説明するように現在のプロ
トタイプに対するDFS係数を計算し、現在のプロトタイプに対するDFS係数
を第2の分解モジュール608 に供給する。この第2の分解モジュール608 は、以
下説明するように現在のプロトタイプに対するDFS係数を振幅および位相ベク
トルに分解する。第2の分解モジュール608 は、その振幅および位相ベクトルを
相関モジュール614 に供給する。
【0050】 第2の分解モジュール608 はまた、現在のプロトタイプに対する振幅および
位相ベクトルを帯域識別モジュール610 に供給する。この帯域識別モジュール61
0 は以下説明するように相関させるために周波数帯域を識別し、帯域識別指標を
相関モジュール614 に供給する。
【0051】 第2の分解モジュール608 はまた、現在のプロトタイプに対する振幅ベクト
ルを振幅ベクトル量子化装置612 に供給する。この振幅ベクトル量子化装置612
は以下説明するように現在のプロトタイプに対する振幅ベクトルを量子化し、送
信のために振幅量子化パラメータを発生させる。特定の実施形態において、振幅
ベクトル量子化装置612 は量子化された振幅値を帯域識別モジュール610 (この
接続は簡明化のために図示されていない)および、または相関モジュール614 に
供給する。
【0052】 相関モジュール614 は以下説明するように全ての周波数帯域において相関を
行って、全ての帯域に対して最適線形位相シフトを決定する。別の実施形態では
、以下説明するように全ての帯域に対して最適円回転を決定するために、相互相
関がパンドパス信号に関して時間ドメインで行われる。相関モジュール614 は線
形位相シフト値を量子化装置616 に供給する。別の実施形態では、相関モジュー
ル614 は円回転値を量子化装置616 に供給する。量子化装置616 は以下説明する
ように受信された値を量子化して、送信のために位相量子化パラメータを発生さ
せる。
【0053】 1実施形態において、プロトタイプの量子化から復元する装置700 は、図9
に示されているようにDFSの構成要素である周波数帯域に関する線形シフトを
使用してプロトタイプ位相スペクトルの再構成を行う。プロトタイプの量子化復
元装置700 は、DFS係数計算モジュール702 と、反転DFS計算モジュール70
4 と、分解モジュール706 と、結合モジュール708 と、帯域識別モジュール710
と、振幅ベクトルを量子化から復元する装置712 と、構成モジュール714 と、お
よび位相を量子化から復元する装置716 とを含んでいる。
【0054】 プロトタイプ量子化復元装置700 において、基準プロトタイプはDFS係数
計算モジュール702 に供給される。DFS係数計算モジュール702 は以下説明す
るように基準プロトタイプに対するDFS係数を計算し、その基準プロトタイプ
に対するDFS係数を分解モジュール706 に供給する。分解モジュール706 は以
下説明するようにその基準プロトタイプに対するDFS係数を振幅および位相ベ
クトルに分解する。分解モジュール706 は基準位相(すなわち、基準プロトタイ
プに対する位相ベクトル)を構成モジュール714 に供給する。
【0055】 位相量子化パラメータは、位相量子化復元装置716 により受取られる。位相
量子化復元装置716 は以下に説明するように受取った位相量子化パラメータを量
子化から復元し、線形位相シフト値を発生させる。この位相を量子化から復元す
る装置716 は線形位相シフト値を分解モジュール714 に供給する。
【0056】 振幅ベクトル量子化パラメータは、振幅ベクトル量子化復元装置712 により
受取られる。振幅ベクトル量子化復元装置712 は以下説明するように受取った振
幅量子化パラメータを量子化から復元し、量子化から復元された振幅値を発生さ
せる。この振幅量子化復元装置712 は量子化から復元された振幅値を結合モジュ
ール708 に供給する。振幅ベクトル量子化復元装置712 はまた量子化から復元さ
れた振幅値を帯域識別モジュール710 に供給する。帯域識別モジュール710 は以
下説明するように結合のために周波数帯域を識別し、帯域識別指標を構成モジュ
ール714 に供給する。
【0057】 構成モジュール714 は、以下説明するように基準位相および線形位相シフト
値から修正された位相ベクトルを構成する。構成モジュール714 は修正された位
相ベクトル値を結合モジュール708 に供給する。
【0058】 結合モジュール708 は以下説明するように量子化から復元された振幅値およ
び位相値を結合し、再構成された修正されたDFS係数ベクトルを発生させる。
結合モジュール708 は結合された振幅および位相ベクトルを反転DFS計算モジ
ュール704 に供給する。反転DFS計算モジュール704 は以下説明するように再
構成された修正されたDFS係数ベクトルの反転DFSを計算し、再構成された
現在のプロトタイプを発生させる。
【0059】 1実施形態において、プロトタイプ量子化復元装置800 は、図9に示されて
いるようにエンコーダにおけるプロトタイプ波形の構成要素であるバンドパス波
形について時間ドメインで行われた円回転を使用してプロトタイプ位相スペクト
ルの再構成を行う。プロトタイプ量子化復元装置800 はDFS係数計算モジュー
ル802 、バンドパス波形合計装置804 、分解モジュール806 、反転DFS/バン
ドパス信号生成モジュール808 、帯域識別モジュール810 、振幅ベクトル量子化
復元装置812 、構成モジュール814 および位相量子化復元装置816 を含んでいる
【0060】 プロトタイプ量子化復元装置800 において、基準プロトタイプはDFS係数
計算モジュール802 に供給される。DFS係数計算モジュール802 は以下説明す
るように基準プロトタイプに対するDFS係数を計算し、基準プロトタイプに対
するDFS係数を分解モジュール806 に供給する。分解モジュール806 は以下説
明するように基準プロトタイプに対するDFS係数を振幅および位相ベクトルに
分解する。分解モジュール806 は基準位相(すなわち、基準プロトタイプの位相
ベクトル)を構成モジュール814 に供給する。
【0061】 位相量子化パラメータは、位相量子化復元装置816 によって受取られる。位
相量子化復元装置816 は以下説明するように受取った位相量子化パラメータを量
子化から復元し、円回転値を発生させる。位相量子化復元装置816 は円回転値を
構成モジュール814 に供給する。
【0062】 振幅ベクトル量子化パラメータは、振幅ベクトル量子化復元装置812 によっ
て受取られる。振幅ベクトル量子化復元装置812 は以下説明するように受取った
振幅量子化パラメータを量子化から復元し、量子化から復元された振幅値を発生
させる。振幅ベクトル量子化復元装置812 は量子化から復元された振幅値を反転
DFS/バンドパス信号生成モジュール808 に供給する。振幅ベクトル量子化復
元装置812 はまた量子化から復元された振幅値を帯域識別モジュール810 に供給
する。帯域識別モジュール810 は以下説明するように結合のために周波数帯域を
識別し、帯域識別指標を反転DFS/バンドパス信号生成モジュール808 に供給
する。
【0063】 この反転DFS/バンドパス信号生成モジュール808 は各帯域に対する量子
化から復元された振幅値と基準位相値を結合し、以下説明するように各帯域に対
する反転DFSを使用してその結合からバンドパス信号を計算する。反転DFS
/バンドパス信号生成モジュール808 は構成モジュール814 にバンドパス信号を
供給する。
【0064】 構成モジュール814 は以下説明するように量子化から復元された円回転値を
使用して各バンドパス信号を円回転させ、回転されたバンドパス信号を生成する
。構成モジュール814 は修正された回転されたバンドパス信号をバンドパス波形
合計装置804 に供給する。バンドパス波形合計装置804 は全てのバンドパス信号
を合計して再構成されたプロトタイプを発生させる。
【0065】 図8のプロトタイプ量子化装置600 と図9のプロトタイプ量子化装置700 は
正常動作で機能して、プロトタイプピッチ周期波形の位相スペクトルをそれぞれ
符号化し、復号する。送信機/エンコーダ(図8)において、現在のフレームの
プロトタイプsC (n)の位相スペクトルφk c はDFS表記:
【数2】 を使用して計算される。ここでCk c は現在のプロトタイプの複素DFS係数で
あり、ω0 c はプロトタイプsC (n)の正規化された基本周波数である。位相
スペクトルφk c はDFSを構成する複素係数の角度である。基準プロトタイプ
の位相スペクトルφk r は同様の方法で計算され、Ck r およびφk r を与える
。その代わりに、基準プロトタイプの位相スペクトルφk r は、基準プロトタイ
プを有するフレームが処理された後で記憶されたものであり、記憶装置から検索
されるに過ぎない。特定の実施形態において、基準プロトタイプは前のフレーム
からのプロトタイプである。基準フレームおよび現在のフレームの両方からの両
プロトタイプに対する複素DFSは、式:
【数3】 に示されているように振幅スペクトルおよび位相スペクトルの積として表される
ことができる。複素DFSもまたベクトルであるため、振幅スペクトルおよび位
相スペクトルはベクトルであることを認識しなければならない。DFSベクトル
の各要素は対応したプロトタイプの時間期間の逆数に等しい周波数の高調波であ
る。最大周波数がFm Hz(少なくとも2Fm Hzのレートでサンプリング
された)であり、高調波振動数がFo Hzの信号に関して、M個の高調波が存
在する。高調波の数MはFm/Foに等しい。したがって、各プロトタイプの位
相スペクトルベクトルおよび振幅スペクトルベクトルはM個の要素から構成され
ている。
【0066】 現在のプロトタイプのDFSベクトルはB個の帯域幅に分割され、B個の各
帯域幅に対応した時間信号はバンドパス信号である。帯域の数Bは高調波の数M
より少ないように制限される。B個のバンドパス時間信号を全て合計することに
よって元の現在のプロトタイプが得られる。同様に、基準プロトタイプに対する
DFSベクトルもまた同数のB個の帯域に分割される。
【0067】 B個の各帯域に関して、基準プロトタイプに対応したバンドパス信号と現在
のプロトタイプに対応したバンドパス信号との間で相互相関が行われる。相互相
関は周波数ドメインのDFSベクトルに関して行われることができる:
【数4】 相互相関はまた式:
【数5】 にしたがって対応した時間ドメインのバンドパス信号に関して行われてもよい(
たとえば、図10の量子化復元装置800 により)。ここでLは現在のプロトタイ
プのサンプルの長さであり、ω0 r およびω0 c はそれぞれ基準プロトタイプお
よび現在のプロトタイプの正規化された基本周波数であり、ri はサンプルの円
回転である。帯域bI に対応したバンドパス時間ドメイン信号Sbi r (n)およ
びSbi c (n)はそれぞれ次式で与えられる:
【数6】
【0068】 1実施形態において、式:
【数7】 で示されるようにCk c を得るために量子化された振幅ベクトル^Ak c が使用
される。基準プロトタイプのバンドパスDFSベクトルの全ての可能な線形位相
シフトに対して相互相関が行われる。その代わりに、基準プロトタイプのバンド
パスDFSベクトルの全ての可能な線形位相シフトのサブセットに対して相互相
関が行われてもよい。別の実施形態では、時間ドメインアプローチが使用され、
基準プロトタイプのバンドパス時間信号の全ての可能な円回転に対して相互相関
が行われる。1実施形態において、基準プロトタイプのバンドパス時間信号の全
ての可能な円回転のサブセットに対して相互相関が行われてもよい。相互相関プ
ロセスにより、B個の各帯域に対する相互相関の最大値に対応したB個の線形位
相シフト(あるいは、時間ドメインにおいてバンドパス時間信号に関して相互相
関が行われる実施形態では、B個の円回転)が発生される。その後、B個の線形
位相シフト(あるいは別の実施形態では、B個の円回転)が量子化され、M個の
元の位相スペクトルベクトル要素の代わりに位相スペクトルを表すものとして送
信される。振幅スペクトルベクトルは別々に量子化され、送信される。したがっ
て、基準プロトタイプのバンドパスDFSベクトル(またはバンドパス時間信号
)は、現在のフレームのプロトタイプの対応したDFSベクトル(またはバンド
パス時間信号)を符号化するためのコードブックとして都合よく機能する。した
がって、位相情報を量子化して送信するために必要な要素の数は少なくなり、そ
れによって結果的に位相情報のサブサンプリングが行われ、送信が効率的に行わ
れる。これは、ビットが不十分なために、位相情報がその多量の位相要素により
ほとんど量子化されず、あるいは位相情報が全く送信されず、その結果いずれも
品質の低下を招いてしまう低ビットレートスピーチコーディングにおいてとくに
有益である。上述した実施形態により、量子化すべき要素が少なくなるために、
低ビットレートコーダは優れた音声品質を維持することが可能となる。
【0069】 受信機/デコーダ(図9)(および当業者に認識されるように、デコーダの
エンコーダのコピー)において、B個の線形位相シフト値が基準プロトタイプの
B帯域分割されたDFSベクトルのデコーダのコピーに適用され、修正されたプ
ロトタイプDFS位相ベクトル:
【数8】 を発生させる。その後、修正されたDFSベクトルは受取られて復号された振幅
スペクトルベクトルと修正されたプロトタイプDFS位相ベクトルの積として得
られる。その後、再構成されたプロトタイプは修正されたDFSベクトルに関す
る反転DFS動作を使用して構成される。時間ドメインアプローチが使用される
別の実施形態において、B個の各帯域に対する振幅スペクトルベクトルおよび同
数のB個の帯域に対する基準プロトタイプの位相ベクトルが結合され、反転DF
S動作がその結合に関して行われ、B個のバンドパス時間信号を発生させる。そ
の後、B個のバンドパス時間信号はB個の円回転値を使用して円回転される。B
個のバンドパス時間信号の全てが合計されて、再構成されたプロトタイプを発生
させる。
【0070】 以上、位相スペクトル情報をサブサンプリングする新しい方法および装置を
説明してきた。当業者は、ここに記載の実施形態と関連されて説明されている種
々の例証的な論理ブロックおよびアルゴリズムのステップがデジタル信号プロセ
ッサ(DSP)、特定用途向け集積回路(ASIC)、離散型ゲートまたはトラ
ンジスタ論理装置、たとえばレジスタおよびFIFO等の離散型ハードウェアコ
ンポーネント、1組のファームウェア命令を実行するプロセッサ、あるいは任意
の通常のプログラム可能なソフトウェアモジュールおよびプロセッサにより構成
され、あるいは行われてもよいことを認識するであろう。プロセッサはマイクロ
プロセッサであると都合がよいが、別の実施形態ではプロセッサは任意の通常の
プロセッサ、制御装置、マイクロ制御装置、または状態マシンであってもよい。
ソフトウェアモジュールはRAMメモリ、フラッシュメモリ、レジスタ、あるい
は任意の他の形態の技術的に知られている書込み可能記憶媒体内に設けられるこ
とができる。当業者はさらに、上記の説明で引用することのできるデータ、命令
、コマンド、情報、信号、ビット、符号、およびチップは、電圧、電流、電磁波
、磁界または粒子、あるいは光学フィールドまたは粒子、もしくはそれらの組合
せで便利に表わされていることを認識するであろう。
【0071】 以上、本発明の好ましい実施形態を図示および説明してきた。しかしながら
、当業者は、ここに開示されている実施形態に対する種々の変更が本発明の技術
的範囲を逸脱することなく行われることが可能であることを認識するであろう。
したがって、本発明は添付された請求の範囲によってのみ限定される。
【図面の簡単な説明】
【図1】 無線電話システムのブロック図。
【図2】 スピーチコーダによって各端末で終端される通信チャンネルのブロック図。
【図3】 エンコーダのブロック図。
【図4】 デコーダのブロック図。
【図5】 スピーチコーディング決定手順を示すフローチャート。
【図6】 スピーチ信号振幅対時間および線形予測(LP)剰余振幅対時間をそれぞれ示
すグラフ。
【図7】 プロトタイプピッチ周期スピーチコーダのブロック図。
【図8】 図7のスピーチコーダで使用されることのできるプロトタイプ量子化装置のブ
ロック図。
【図9】 図7のスピーチコーダで使用されることのできるプロトタイプの量子化から復
元する装置のブロック図。
【図10】 図7のスピーチコーダで使用されることのできるプロトタイプの量子化から復
元する装置のブロック図。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 7/04 G (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AG,AL,AM,AT, AU,AZ,BA,BB,BG,BR,BY,BZ,C A,CH,CN,CR,CU,CZ,DE,DK,DM ,DZ,EE,ES,FI,GB,GD,GE,GH, GM,HR,HU,ID,IL,IN,IS,JP,K E,KG,KP,KR,KZ,LC,LK,LR,LS ,LT,LU,LV,MA,MD,MG,MK,MN, MW,MX,MZ,NO,NZ,PL,PT,RO,R U,SD,SE,SG,SI,SK,SL,TJ,TM ,TR,TT,TZ,UA,UG,UZ,VN,YU, ZA,ZW Fターム(参考) 5D045 CC02 CC07 5J064 AA01 BA16 BB03 BC02 BC03 BC16 BD02 【要約の続き】 と関連させられ、そのバンドパス波形を円回転値に基づ いて修正する。

Claims (81)

    【特許請求の範囲】
  1. 【請求項1】 基準プロトタイプの複数の位相パラメータを生成し、 プロトタイプの複数の位相パラメータを発生させ、 プロトタイプの位相パラメータを基準プロトタイプの位相パラメータと複数の
    周波数帯域において相関させるステップを含んでいるスピーチコーダにおけるフ
    レームのプロトタイプを処理する方法。
  2. 【請求項2】 生成するステップは、基準プロトタイプに対する離散フーリ
    エ級数係数を計算し、その離散フーリエ級数係数をその基準プロトタイプに対す
    る振幅ベクトルおよび位相ベクトルに分解するステップを含んでおり、発生させ
    るステップは、プロトタイプに対する離散フーリエ級数係数を計算し、その離散
    フーリエ級数係数をそのプロトタイプに対する振幅ベクトルおよび位相ベクトル
    に分解するステップを含んでいる請求項1記載の方法。
  3. 【請求項3】 相関させるステップを行うべき周波数帯域を識別するステッ
    プをさらに含んでいる請求項1記載の方法。
  4. 【請求項4】 フレームはスピーチフレームである請求項1記載の方法。
  5. 【請求項5】 フレームは線形予測剰余のフレームである請求項1記載の方
    法。
  6. 【請求項6】 相関させるステップは、プロトタイプに対する複数の最適線
    形位相シフト値を発生させる請求項1記載の方法。
  7. 【請求項7】 相関させるステップは、プロトタイプに対する複数の最適円
    回転値を発生させる請求項1記載の方法。
  8. 【請求項8】 線形位相シフト値を量子化し、プロトタイプに対する複数の
    振幅パラメータを量子化するステップをさらに含んでいる請求項6記載の方法。
  9. 【請求項9】 円回転値を量子化し、プロトタイプに対する複数の振幅パラ
    メータを量子化するステップをさらに含んでいる請求項7記載の方法。
  10. 【請求項10】 基準プロトタイプの複数の位相パラメータを生成し、 プロトタイプに関連した複数の線形位相シフト値を発生させ、 その位相パラメータとその線形位相シフト値から位相ベクトルを複数の周波数
    帯域にわたって構成するステップを含んでいるスピーチコーダにおけるフレーム
    のプロトタイプの処理方法。
  11. 【請求項11】 生成するステップは、基準プロトタイプに対する離散フー
    リエ級数係数を計算し、その離散フーリエ級数係数をその基準プロトタイプに対
    する振幅ベクトルおよび位相ベクトルに分解するステップを含んでいる請求項1
    0記載の方法。
  12. 【請求項12】 構成するステップを行うべき周波数帯域を識別するステッ
    プをさらに含んでいる請求項10記載の方法。
  13. 【請求項13】 フレームはスピーチフレームである請求項10記載の方法
  14. 【請求項14】 フレームは線形予測剰余のフレームである請求項10記載
    の方法。
  15. 【請求項15】 発生させるステップにおいて、複数の線形位相シフト値を
    発生させるためにプロトタイプに関連した複数の量子化された位相パラメータを
    量子化される前の形態に戻す請求項10記載の方法。
  16. 【請求項16】 複数の量子化される前の形態に戻された振幅パラメータを
    生成するためにプロトタイプに関連した複数の振幅量子化パラメータを量子化さ
    れる前の形態に戻すステップをさらに含んでおり、識別するステップにおいて、
    帯域は複数の量子化される前の形態に戻された振幅パラメータに基づいて識別さ
    れる請求項12記載の方法。
  17. 【請求項17】 構成された位相ベクトルをプロトタイプと関連した複数の
    振幅パラメータと組合せて組合せベクトルを生成し、その組合せベクトルの逆離
    散フーリエ級数を計算してプロトタイプの再構成されたバージョンを生成するス
    テップをさらに含んでいる請求項10記載の方法。
  18. 【請求項18】 プロトタイプに関連した複数の円回転値を生成し、 複数のバンドパス波形を複数の周波数帯域において発生させ、その複数のバン
    ドパス波形が基準プロトタイプの複数の位相パラメータと関連され、 複数のバンドパス波形を複数の円回転値に基づいて修正するステップを含んで
    いるスピーチコーダにおけるフレームのプロトタイプの処理方法。
  19. 【請求項19】 発生させるステップを行うべき周波数帯域を識別するステ
    ップをさらに含んでいる請求項18記載の方法。
  20. 【請求項20】 フレームはスピーチフレームである請求項18記載の方法
  21. 【請求項21】 フレームは線形予測剰余のフレームである請求項18記載
    の方法。
  22. 【請求項22】 生成するステップにおいて、複数の円回転値を発生させる
    ためにプロトタイプに関連した複数の量子化された位相パラメータが量子化され
    る前の形態に戻される請求項18記載の方法。
  23. 【請求項23】 複数の量子化される前の形態に戻された振幅パラメータを
    生成するためにプロトタイプに関連した複数の振幅量子化パラメータを量子化さ
    れる前の形態に戻すステップをさらに含んでおり、識別するステップにおいて、
    帯域は複数の量子化される前の形態に戻された振幅パラメータに基づいて識別さ
    れる請求項19記載の方法。
  24. 【請求項24】 発生させるステップは、基準プロトタイプに対する離散フ
    ーリエ級数係数を計算し、その離散フーリエ級数係数をその基準プロトタイプに
    対する振幅ベクトルおよび位相ベクトルに分解し、位相ベクトルを複数の量子化
    される前の形態に戻された振幅パラメータと組合せ、その位相ベクトルの逆離散
    フーリエ級数を計算して複数のバンドパス波形を発生させるステップを含んでい
    る請求項23記載の方法。
  25. 【請求項25】 複数の修正されたバンドパス波形を合計してプロトタイプ
    の再構成されたバージョンを生成するステップをさらに含んでいる請求項18記
    載の方法。
  26. 【請求項26】 フレームの基準プロトタイプの複数の位相パラメータを生
    成する手段と、 現在のフレームの現在のプロトタイプの複数の位相パラメータを発生させる手
    段と、 現在のプロトタイプの位相パラメータを基準プロトタイプの位相パラメータと
    複数の周波数帯域において相関させる手段とを具備しているスピーチコーダ。
  27. 【請求項27】 生成する手段は、基準プロトタイプに対する離散フーリエ
    級数係数を計算する手段と、その離散フーリエ級数係数をその基準プロトタイプ
    に対する振幅ベクトルおよび位相ベクトルに分解する手段とを含んでおり、発生
    させる手段は、現在のプロトタイプに対する離散フーリエ級数係数を計算する手
    段と、その離散フーリエ級数係数をその現在のプロトタイプに対する振幅ベクト
    ルおよび位相ベクトルに分解する手段とを備えている請求項26記載のスピーチ
    コーダ。
  28. 【請求項28】 複数の周波数帯域を識別する手段をさらに含んでいる請求
    項26記載のスピーチコーダ。
  29. 【請求項29】 現在のフレームはスピーチフレームである請求項26記載
    のスピーチコーダ。
  30. 【請求項30】 現在のフレームは線形予測剰余のフレームである請求項2
    6記載のスピーチコーダ。
  31. 【請求項31】 相関させる手段は、現在のプロトタイプに対する複数の最
    適線形位相シフト値を発生させる請求項26記載のスピーチコーダ。
  32. 【請求項32】 相関させる手段は、現在のプロトタイプに対する複数の最
    適円回転値を発生させる請求項26記載のスピーチコーダ。
  33. 【請求項33】 線形位相シフト値を量子化する手段と、現在のプロトタイ
    プに対する複数の振幅パラメータを量子化する手段とをさらに含んでいる請求項
    26記載のスピーチコーダ。
  34. 【請求項34】 円回転値を量子化する手段と、現在のプロトタイプに対す
    る複数の振幅パラメータを量子化する手段とをさらに含んでいる請求項26記載
    のスピーチコーダ。
  35. 【請求項35】 スピーチコーダは、無線通信システムの加入者装置内に設
    けられている請求項26記載のスピーチコーダ。
  36. 【請求項36】 フレームの基準プロトタイプの複数の位相パラメータを生
    成する手段と、 現在のフレームの現在のプロトタイプに関連した複数の線形位相シフト値を発
    生させる手段と、 位相パラメータと線形位相シフト値から位相ベクトルを複数の周波数帯域にわ
    たって構成する手段とを具備しているスピーチコーダ。
  37. 【請求項37】 生成する手段は、基準プロトタイプに対する離散フーリエ
    級数係数を計算する手段と、その離散フーリエ級数係数をその基準プロトタイプ
    に対する振幅ベクトルおよび位相ベクトルに分解する手段とを含んでいる請求項
    36記載のスピーチコーダ。
  38. 【請求項38】 複数の周波数帯域を識別する手段をさらに含んでいる請求
    項36記載のスピーチコーダ。
  39. 【請求項39】 現在のフレームはスピーチフレームである請求項36記載
    のスピーチコーダ。
  40. 【請求項40】 現在のフレームは線形予測剰余のフレームである請求項3
    6記載のスピーチコーダ。
  41. 【請求項41】 発生させる手段は、複数の線形位相シフト値を発生させる
    ために現在のプロトタイプに関連した複数の量子化された位相パラメータを量子
    化される前の形態に戻す手段を含んでいる請求項36記載のスピーチコーダ。
  42. 【請求項42】 複数の量子化される前の形態に戻された振幅パラメータを
    生成するために現在のプロトタイプに関連した複数の振幅量子化パラメータを量
    子化される前の形態に戻す手段をさらに含んでおり、識別する手段は、複数の量
    子化される前の形態に戻された振幅パラメータに基づいて複数の帯域を識別する
    手段を含んでいる請求項38記載のスピーチコーダ。
  43. 【請求項43】 構成された位相ベクトルを現在のプロトタイプと関連した
    複数の振幅パラメータと組合せて組合せベクトルを生成する手段と、その組合せ
    ベクトルの逆離散フーリエ級数を計算して現在のプロトタイプの再構成されたバ
    ージョンを生成する手段とをさらに含んでいる請求項36記載のスピーチコーダ
  44. 【請求項44】 スピーチコーダは、無線通信システムの加入者装置内に設
    けられている請求項36記載のスピーチコーダ。
  45. 【請求項45】 現在のフレームの現在のプロトタイプに関連した複数の円
    回転値を生成する手段と、 フレームの基準プロトタイプの複数の位相パラメータと関連した複数のバンド
    パス波形を複数の周波数帯域で発生させる手段と、 複数のバンドパス波形を複数の円回転値に基づいて修正する手段とを具備して
    いるスピーチコーダ。
  46. 【請求項46】 複数の周波数帯域を識別する手段をさらに含んでいる請求
    項45記載のスピーチコーダ。
  47. 【請求項47】 現在のフレームはスピーチフレームである請求項45記載
    のスピーチコーダ。
  48. 【請求項48】 現在のフレームは線形予測剰余のフレームである請求項4
    5記載のスピーチコーダ。
  49. 【請求項49】 生成する手段は、複数の円回転値を発生させるために現在
    のプロトタイプに関連した複数の量子化された位相パラメータを量子化される前
    の形態に戻す手段を含んでいる請求項45記載のスピーチコーダ。
  50. 【請求項50】 複数の量子化される前の形態に戻された振幅パラメータを
    生成するために現在のプロトタイプに関連した複数の振幅量子化パラメータを量
    子化される前の形態に戻す手段をさらに含んでおり、識別する手段は、複数の量
    子化される前の形態に戻された振幅パラメータに基づいて帯域を識別する手段を
    含んでいる請求項46記載のスピーチコーダ。
  51. 【請求項51】 発生させる手段は、基準プロトタイプに対する離散フーリ
    エ級数係数を計算する手段と、その離散フーリエ級数係数をその基準プロトタイ
    プに対する振幅ベクトルおよび位相ベクトルに分解する手段と、位相ベクトルを
    複数の量子化される前の形態に戻された振幅パラメータと組合せる手段と、その
    位相ベクトルの逆離散フーリエ級数を計算して複数のバンドパス波形を発生させ
    る手段とを含んでいる請求項50記載のスピーチコーダ。
  52. 【請求項52】 複数の修正されたバンドパス波形を合計して現在のプロト
    タイプの再構成されたバージョンを生成する手段をさらに含んでいる請求項45
    記載のスピーチコーダ。
  53. 【請求項53】 スピーチコーダは、無線通信システムの加入者装置内に設
    けられている請求項45記載のスピーチコーダ。
  54. 【請求項54】 スピーチコーダによって処理されている現在のフレームか
    ら現在のプロトタイプを抽出するように構成されたプロトタイプ抽出装置と、 プロトタイプ抽出装置に結合され、フレームの基準プロトタイプの複数の位相
    パラメータを生成し、現在のプロトタイプの複数の位相パラメータを発生させ、
    現在のプロトタイプの位相パラメータを基準プロトタイプの位相パラメータと複
    数の周波数帯域において相関させるように構成されたプロトタイプ量子化装置と
    を具備しているスピーチコーダ。
  55. 【請求項55】 プロトタイプ量子化装置はさらに、基準プロトタイプに対
    する離散フーリエ級数係数を計算し、その離散フーリエ級数係数をその基準プロ
    トタイプに対する振幅ベクトルおよび位相ベクトルに分解し、現在のプロトタイ
    プに対する離散フーリエ級数係数を計算し、その離散フーリエ級数係数をその現
    在のプロトタイプに対する振幅ベクトルおよび位相ベクトルに分解するように構
    成されている請求項54記載のスピーチコーダ。
  56. 【請求項56】 プロトタイプ量子化装置はさらに、複数の周波数帯域を識
    別するように構成されている請求項54記載のスピーチコーダ。
  57. 【請求項57】 現在のフレームはスピーチフレームである請求項54記載
    のスピーチコーダ。
  58. 【請求項58】 現在のフレームは線形予測剰余のフレームである請求項5
    4記載のスピーチコーダ。
  59. 【請求項59】 プロトタイプ量子化装置はさらに、現在のプロトタイプに
    対する複数の最適線形位相シフト値を発生させるように構成されている請求項5
    4記載のスピーチコーダ。
  60. 【請求項60】 プロトタイプ量子化装置はさらに、現在のプロトタイプに
    対する複数の最適円回転値を発生させるように構成されている請求項54記載の
    スピーチコーダ。
  61. 【請求項61】 プロトタイプ量子化装置はさらに、線形位相シフト値を量
    子化し、現在のプロトタイプに対する複数の振幅パラメータを量子化するように
    構成されている請求項59記載のスピーチコーダ。
  62. 【請求項62】 プロトタイプ量子化装置はさらに、円回転値を量子化し、
    現在のプロトタイプに対する複数の振幅パラメータを量子化するように構成され
    ている請求項60記載のスピーチコーダ。
  63. 【請求項63】 スピーチコーダは、無線通信システムの加入者装置内に設
    けられている請求項54記載のスピーチコーダ。
  64. 【請求項64】 スピーチコーダによって処理されている現在のフレームか
    ら現在のプロトタイプを抽出するように構成されたプロトタイプ抽出装置と、 プロトタイプ抽出装置に結合され、フレームの基準プロトタイプの複数の位相
    パラメータを生成し、現在のプロトタイプに関連した複数の線形位相シフト値を
    発生させ、その位相パラメータとその線形位相シフト値から位相ベクトルを複数
    の周波数帯域にわたって形成するように構成されたプロトタイプ量子化装置とを
    具備しているスピーチコーダ。
  65. 【請求項65】 プロトタイプ量子化装置はさらに、基準プロトタイプに対
    する離散フーリエ級数係数を計算し、その離散フーリエ級数係数をその基準プロ
    トタイプに対する振幅ベクトルおよび位相ベクトルに分解するように構成されて
    いる請求項64記載のスピーチコーダ。
  66. 【請求項66】 プロトタイプ量子化装置はさらに、複数の周波数帯域を識
    別するように構成されている請求項64記載のスピーチコーダ。
  67. 【請求項67】 現在のフレームはスピーチフレームである請求項64記載
    のスピーチコーダ。
  68. 【請求項68】 現在のフレームは線形予測剰余のフレームである請求項6
    4記載のスピーチコーダ。
  69. 【請求項69】 プロトタイプ量子化装置はさらに、複数の線形位相シフト
    値を発生させるために現在のプロトタイプに関連した複数の量子化された位相パ
    ラメータを量子化される前の形態に戻すように構成されている請求項64記載の
    スピーチコーダ。
  70. 【請求項70】 プロトタイプ量子化装置はさらに、複数の量子化される前
    の形態に戻された振幅パラメータを生成するために現在のプロトタイプに関連し
    た複数の振幅量子化パラメータをさらに量子化される前の形態に戻し、複数の量
    子化される前の形態に戻された振幅パラメータに基づいて複数の帯域を識別する
    ように構成されている請求項66記載のスピーチコーダ。
  71. 【請求項71】 プロトタイプ量子化装置はさらに、位相ベクトルを現在の
    プロトタイプと関連した複数の振幅パラメータと組合せて組合せベクトルを生成
    し、その組合せベクトルの逆離散フーリエ級数を計算して現在のプロトタイプの
    再構成されたバージョンを生成するように構成されている請求項64記載のスピ
    ーチコーダ。
  72. 【請求項72】 スピーチコーダは、無線通信システムの加入者装置内に設
    けられている請求項64記載のスピーチコーダ。
  73. 【請求項73】 スピーチコーダによって処理されている現在のフレームか
    ら現在のプロトタイプを抽出するように構成されたプロトタイプ抽出装置と、 プロトタイプ抽出装置に結合され、現在のプロトタイプに関連した複数の円回
    転値を生成し、フレームの基準プロトタイプの複数の位相パラメータに関連して
    いる複数のバンドパス波形を発生させ、複数の円回転値に基づいて複数のバンド
    パス波形を修正するように構成されているプロトタイプ量子化装置とを具備して
    いるスピーチコーダ。
  74. 【請求項74】 プロトタイプ量子化装置はさらに、複数の周波数帯域を識
    別するように構成されている請求項73記載のスピーチコーダ。
  75. 【請求項75】 現在のフレームはスピーチフレームである請求項73記載
    のスピーチコーダ。
  76. 【請求項76】 現在のフレームは線形予測剰余のフレームである請求項7
    3記載のスピーチコーダ。
  77. 【請求項77】 プロトタイプ量子化装置はさらに、複数の円回転値を発生
    させるために現在のプロトタイプに関連した複数の量子化された位相パラメータ
    を量子化される前の形態に戻すように構成されている請求項73記載のスピーチ
    コーダ。
  78. 【請求項78】 プロトタイプ量子化装置はさらに、複数の量子化される前
    の形態に戻された振幅パラメータを生成するために現在のプロトタイプに関連し
    た複数の振幅量子化パラメータを量子化される前の形態に戻し、複数の量子化さ
    れる前の形態に戻された振幅パラメータに基づいて周波数帯域を識別するように
    構成されている請求項74記載のスピーチコーダ。
  79. 【請求項79】 プロトタイプ量子化装置はさらに、基準プロトタイプに対
    する離散フーリエ級数係数を計算し、その離散フーリエ級数係数をその基準プロ
    トタイプに対する振幅ベクトルおよび位相ベクトルに分解し、位相ベクトルを複
    数の量子化される前の形態に戻された振幅パラメータと組合せ、その位相ベクト
    ルの逆離散フーリエ級数を計算して複数のバンドパス波形を発生させるように構
    成されている請求項78記載のスピーチコーダ。
  80. 【請求項80】 プロトタイプ量子化装置はさらに、複数の修正されたバン
    ドパス波形を合計して現在のプロトタイプの再構成されたバージョンを生成する
    ように構成されている請求項73記載のスピーチコーダ。
  81. 【請求項81】 スピーチコーダは、無線通信システムの加入者装置内に設
    けられている請求項73記載のスピーチコーダ。
JP2001511667A 1999-07-19 2000-07-18 位相スペクトル情報をサブサンプリングする方法および装置 Expired - Lifetime JP4860859B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/356,491 1999-07-19
US09/356,491 US6397175B1 (en) 1999-07-19 1999-07-19 Method and apparatus for subsampling phase spectrum information
PCT/US2000/019601 WO2001006492A1 (en) 1999-07-19 2000-07-18 Method and apparatus for subsampling phase spectrum information

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007213061A Division JP4861271B2 (ja) 1999-07-19 2007-08-17 位相スペクトル情報をサブサンプリングする方法および装置

Publications (3)

Publication Number Publication Date
JP2003517157A true JP2003517157A (ja) 2003-05-20
JP2003517157A5 JP2003517157A5 (ja) 2007-10-04
JP4860859B2 JP4860859B2 (ja) 2012-01-25

Family

ID=23401657

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2001511667A Expired - Lifetime JP4860859B2 (ja) 1999-07-19 2000-07-18 位相スペクトル情報をサブサンプリングする方法および装置
JP2007213061A Expired - Lifetime JP4861271B2 (ja) 1999-07-19 2007-08-17 位相スペクトル情報をサブサンプリングする方法および装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2007213061A Expired - Lifetime JP4861271B2 (ja) 1999-07-19 2007-08-17 位相スペクトル情報をサブサンプリングする方法および装置

Country Status (12)

Country Link
US (3) US6397175B1 (ja)
EP (2) EP1617416B1 (ja)
JP (2) JP4860859B2 (ja)
KR (2) KR100752001B1 (ja)
CN (2) CN1279510C (ja)
AT (2) ATE309600T1 (ja)
AU (1) AU6221600A (ja)
BR (1) BRPI0012537B1 (ja)
DE (2) DE60023913T2 (ja)
ES (2) ES2256022T3 (ja)
HK (3) HK1064196A1 (ja)
WO (1) WO2001006492A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015508911A (ja) * 2012-02-27 2015-03-23 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 知覚的オーディオコーデックにおけるハーモニック信号のための位相コヒーレンス制御

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE420432T1 (de) * 2000-04-24 2009-01-15 Qualcomm Inc Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen
JP4178319B2 (ja) * 2002-09-13 2008-11-12 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声処理におけるフェーズ・アライメント
US6789058B2 (en) * 2002-10-15 2004-09-07 Mindspeed Technologies, Inc. Complexity resource manager for multi-channel speech processing
US7376553B2 (en) * 2003-07-08 2008-05-20 Robert Patel Quinn Fractal harmonic overtone mapping of speech and musical sounds
DE602004004950T2 (de) * 2003-07-09 2007-10-31 Samsung Electronics Co., Ltd., Suwon Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren
EP3561810B1 (en) * 2004-04-05 2023-03-29 Koninklijke Philips N.V. Method of encoding left and right audio input signals, corresponding encoder, decoder and computer program product
JP4207902B2 (ja) * 2005-02-02 2009-01-14 ヤマハ株式会社 音声合成装置およびプログラム
TWI358056B (en) * 2005-12-02 2012-02-11 Qualcomm Inc Systems, methods, and apparatus for frequency-doma
US8346544B2 (en) * 2006-01-20 2013-01-01 Qualcomm Incorporated Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision
US8032369B2 (en) * 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US8090573B2 (en) * 2006-01-20 2012-01-03 Qualcomm Incorporated Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision
WO2008045846A1 (en) * 2006-10-10 2008-04-17 Qualcomm Incorporated Method and apparatus for encoding and decoding audio signals
KR20090122143A (ko) * 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
HUE045991T2 (hu) * 2013-02-05 2020-01-28 Ericsson Telefon Ab L M Hangkeret-elvesztés elrejtése
ES2955962T3 (es) 2015-09-25 2023-12-11 Voiceage Corp Método y sistema que utiliza una diferencia de correlación a largo plazo entre los canales izquierdo y derecho para mezcla descendente en el dominio del tiempo de una señal de sonido estéreo en canales primarios y secundarios
CN107424616B (zh) * 2017-08-21 2020-09-11 广东工业大学 一种相位谱去除掩模的方法与装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0793000A (ja) * 1993-09-27 1995-04-07 Mitsubishi Electric Corp 音声符号化装置
JPH10307599A (ja) * 1997-03-10 1998-11-17 Lucent Technol Inc スプラインを使用する波形補間音声コーディング

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5067158A (en) * 1985-06-11 1991-11-19 Texas Instruments Incorporated Linear predictive residual representation via non-iterative spectral reconstruction
US4901307A (en) 1986-10-17 1990-02-13 Qualcomm, Inc. Spread spectrum multiple access communication system using satellite or terrestrial repeaters
US5023910A (en) * 1988-04-08 1991-06-11 At&T Bell Laboratories Vector quantization in a harmonic speech coding arrangement
EP0422232B1 (en) * 1989-04-25 1996-11-13 Kabushiki Kaisha Toshiba Voice encoder
JPH0332228A (ja) * 1989-06-29 1991-02-12 Fujitsu Ltd ゲイン―シェイプ・ベクトル量子化方式
US5263119A (en) * 1989-06-29 1993-11-16 Fujitsu Limited Gain-shape vector quantization method and apparatus
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
US5103459B1 (en) 1990-06-25 1999-07-06 Qualcomm Inc System and method for generating signal waveforms in a cdma cellular telephone system
ES2225321T3 (es) 1991-06-11 2005-03-16 Qualcomm Incorporated Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos.
US5884253A (en) 1992-04-09 1999-03-16 Lucent Technologies, Inc. Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter
US5517595A (en) 1994-02-08 1996-05-14 At&T Corp. Decomposition in noise and periodic signal waveforms in waveform interpolation
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
TW271524B (ja) 1994-08-05 1996-03-01 Qualcomm Inc
JPH08123494A (ja) * 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
US5692098A (en) * 1995-03-30 1997-11-25 Harris Real-time Mozer phase recoding using a neural-network for speech compression
IT1277194B1 (it) 1995-06-28 1997-11-05 Alcatel Italia Metodo e relativi apparati di codifica e di decodifica di un segnale vocale campionato
US5701391A (en) * 1995-10-31 1997-12-23 Motorola, Inc. Method and system for compressing a speech signal using envelope modulation
WO1998005029A1 (en) * 1996-07-30 1998-02-05 British Telecommunications Public Limited Company Speech coding
JPH11224099A (ja) * 1998-02-06 1999-08-17 Sony Corp 位相量子化装置及び方法
EP0987680B1 (en) * 1998-09-17 2008-07-16 BRITISH TELECOMMUNICATIONS public limited company Audio signal processing
US6266644B1 (en) * 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
US6754630B2 (en) 1998-11-13 2004-06-22 Qualcomm, Inc. Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation
US6640209B1 (en) * 1999-02-26 2003-10-28 Qualcomm Incorporated Closed-loop multimode mixed-domain linear prediction (MDLP) speech coder
US6449592B1 (en) * 1999-02-26 2002-09-10 Qualcomm Incorporated Method and apparatus for tracking the phase of a quasi-periodic signal
US6138089A (en) * 1999-03-10 2000-10-24 Infolio, Inc. Apparatus system and method for speech compression and decompression
AU4072400A (en) * 1999-04-05 2000-10-23 Hughes Electronics Corporation A voicing measure as an estimate of signal periodicity for frequency domain interpolative speech codec system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0793000A (ja) * 1993-09-27 1995-04-07 Mitsubishi Electric Corp 音声符号化装置
JPH10307599A (ja) * 1997-03-10 1998-11-17 Lucent Technol Inc スプラインを使用する波形補間音声コーディング

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015508911A (ja) * 2012-02-27 2015-03-23 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 知覚的オーディオコーデックにおけるハーモニック信号のための位相コヒーレンス制御
US10818304B2 (en) 2012-02-27 2020-10-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Phase coherence control for harmonic signals in perceptual audio codecs

Also Published As

Publication number Publication date
ATE379832T1 (de) 2007-12-15
BRPI0012537B1 (pt) 2016-06-21
US20050119880A1 (en) 2005-06-02
CN1375095A (zh) 2002-10-16
US7085712B2 (en) 2006-08-01
CN1279510C (zh) 2006-10-11
DE60037286D1 (de) 2008-01-10
HK1047816A1 (en) 2003-03-07
EP1204968B1 (en) 2005-11-09
DE60037286T2 (de) 2008-10-09
HK1064196A1 (en) 2005-01-21
ATE309600T1 (de) 2005-11-15
EP1617416A3 (en) 2006-05-03
KR100754580B1 (ko) 2007-09-05
US20020095283A1 (en) 2002-07-18
WO2001006492A1 (en) 2001-01-25
HK1047816B (zh) 2007-03-16
HK1091583A1 (en) 2007-01-19
KR100752001B1 (ko) 2007-08-28
BR0012537A (pt) 2002-11-26
KR20070051950A (ko) 2007-05-18
KR20020013966A (ko) 2002-02-21
ES2297578T3 (es) 2008-05-01
EP1617416B1 (en) 2007-11-28
US6397175B1 (en) 2002-05-28
DE60023913T2 (de) 2006-08-10
CN1290077C (zh) 2006-12-13
AU6221600A (en) 2001-02-05
JP4860859B2 (ja) 2012-01-25
JP2008040509A (ja) 2008-02-21
DE60023913D1 (de) 2005-12-15
US6678649B2 (en) 2004-01-13
JP4861271B2 (ja) 2012-01-25
CN1510660A (zh) 2004-07-07
EP1204968A1 (en) 2002-05-15
EP1617416A2 (en) 2006-01-18
ES2256022T3 (es) 2006-07-16

Similar Documents

Publication Publication Date Title
JP4861271B2 (ja) 位相スペクトル情報をサブサンプリングする方法および装置
KR100804461B1 (ko) 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치
KR100898323B1 (ko) 음성 코더용 스펙트럼 크기 양자화 방법
JP4870313B2 (ja) 可変レート音声符号器におけるフレーム消去補償方法
JP4782332B2 (ja) 音声符号器における目標ビットレートを維持する方法および装置
JP2003524939A (ja) フレーム抹消条件下で予測音声コーダの性能を改良するためにデコーダからエンコーダにフィードバックを供給するための方法および装置
JP2003524796A (ja) 音声コーダにおける線スペクトル情報量子化方法を交錯するための方法および装置
JP4860860B2 (ja) スピーチコーダにおいてフレームプロトタイプ間の線形位相シフトを計算するために周波数帯域を識別する方法および装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070718

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070817

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100525

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100825

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110907

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111004

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111104

R150 Certificate of patent or registration of utility model

Ref document number: 4860859

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141111

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term