JP2003505724A - 音声符号器用のスペクトル・マグニチュード量子化 - Google Patents

音声符号器用のスペクトル・マグニチュード量子化

Info

Publication number
JP2003505724A
JP2003505724A JP2001511668A JP2001511668A JP2003505724A JP 2003505724 A JP2003505724 A JP 2003505724A JP 2001511668 A JP2001511668 A JP 2001511668A JP 2001511668 A JP2001511668 A JP 2001511668A JP 2003505724 A JP2003505724 A JP 2003505724A
Authority
JP
Japan
Prior art keywords
vector
speech
frame
speech coder
differentially
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001511668A
Other languages
English (en)
Other versions
JP2003505724A5 (ja
JP4659314B2 (ja
Inventor
チョイ、エディー・ルン・ティク
マンジュナス、シャラス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2003505724A publication Critical patent/JP2003505724A/ja
Publication of JP2003505724A5 publication Critical patent/JP2003505724A5/ja
Application granted granted Critical
Publication of JP4659314B2 publication Critical patent/JP4659314B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Interface Circuits In Exchanges (AREA)

Abstract

(57)【要約】 低ビットレート音声符号器用の振幅量子化スキームはフレームからスペクトル情報のベクトルを抽出する第1の工程を含む。ベクトルのエネルギは利得ファクタを発生するために正規化される(1301)。利得ファクタは差動的に量子化されたベクトルである。正規化された(1301)利得ファクタは、非均一にダウンサンプルされて、一組の非均一周波数帯域と関連する要素を持つ固定ディメンションのベクトルを発生する。固定ディメンションのベクトルは2つまたはそれ以上のサブベクトルに分割される。サブベクトルは、調波クローニング処理で最良の有利な点に差動的に量子化される。

Description

【発明の詳細な説明】
【0001】 発明の背景 1.発明の分野 本発明は、一般には音声処理の分野に関し、より明確には音声符号器における
パラメータ量子化に関する。
【0002】 2.従来の技術 ディジタル技術による音声の送信は、特に遠距離ディジタル無線電話の応用に
おいて普及してきた。また、これは復元された音声の知覚品質を維持しつつ、1
チャネルにより送ることができる最少量の情報を決定することへの関心を作り出
した。音声を単にサンプリングしディジタル化して送信する場合に、従来のアナ
ログ電話の音声品質を達成するには、64キロビット/秒(kbps)のオーダ
のデータレートが必要である。しかしながら、音声解析、さらには受信器での適
切な符号化,送信及び再合成の使用により、上記データレートをかなり減じるこ
とが可能である。
【0003】 音声圧縮用の装置は、電気通信の多くの分野での用途を見い出されている。そ
の一つとして、無線通信の分野がある。この無線通信分野は、例えば、コードレ
ス電話、ページング(ポケットベル(登録商標))、無線自局ループ、セルラや PCS電話システムのような無線電話、移動体インターネットプロトコル(IP )電話、及び衛星通信システムを含む多くの応用を有する。特に重要な応用は、 移動体加入者用の無線電話である。
【0004】 例えば、周波数分割多重アクセス(FDMA),時分割多重アクセス(TDM
A)及び符号分割多重アクセス(CDMA)を含む無線通信用に、種々の大気中
送信インターフェイスが開発されている。これに関して、例えば、アドバンスト
移動体電話サービス(AMPS),移動通信用グローバルシステム(GSM),
及びIS−95(Interim Standard 95)を含む種々の国内及び国際標準が確立
されている。例示的な無線電話通信システムは、符号分割多重アクセス(CDM
A)システムである。IS−95標準及びその派生物、IS−95A,ANSI
J−STD−008,IS−95B,提案された第3世代標準IS−95Cと
IS−2000等(本明細書中では、これらをまとめてIS−95と呼称する)
は、電気通信工業協会(TIA)と、セルラまたはPCS電話通信システム用の
CDMA大気中送信インターフェイスの使用を規定する他の周知の標準団体によ
り公表されている。実質的にIS−95標準の使用に従って構成された例示的な
無線通信システムは、本発明の譲受人に譲渡された米国特許第5,103,45
9号及び第4,901,307号に記述されており、この引用により完全に本明
細書中に組み込まれるものである。
【0005】 人間の音声発生のモデルに関連しているパラメータを抽出することにより音声
を圧縮する技術を使用する装置は、音声符号器と呼ばれる。この音声符号器は、
到来音声信号を時間のブロックまたは解析フレームに分割する。音声符号器は、
典型的に、符号器と復号器とから成る。符号器は、ある関連パラメータを抽出す
るために到来音声フレームを解析し、そしてその後、このパラメータをバイナリ
表記、つまり1組のビット即ちバイナリデータパケット、に量子化する。このデ
ータパケットは、通信チャネルを通して受信器及び復号器に送信される。復号器
は、データパケットを処理し、パラメータを生成するためにそれらを量子化解除
し(unquantizes)、そして、その量子化解除されたパラメータを使用して音声
フレームを再合成する。
【0006】 音声符号器の機能は、ディジタル化された音声信号を、音声に固有のすべての
自然の冗長度を取り除くことにより、低ビットレート信号に圧縮することである
。ディジタル圧縮は、入力音声フレームを1組のパラメータにより表し、そのパ
ラメータを量子化を使用して1組のビットで表すことによって達成される。もし
入力音声フレームがビット数Niを有し、そして音声符号器により生成されたデ
ータパケットがビット数Noを有するならば、音声符号器により達成される圧縮
ファクタCr=Ni/Noである。挑戦は、目標の圧縮ファクタを達成すると同時
に、復号された音声の高い音声品質を維持することである。音声符号器の性能は
、(1)音声モデル、または上述された解析処理と合成処理の結合がいかによく
行われるか、そして(2)パラメータ量子化処理が目標のビットレートNoビッ
ト/フレームでいかによく行われるか、次第である。従って、音声モデルのゴー
ルは、各フレームのための小さい組のパラメータで、音声信号の本質、即ち目標
の音声品質、を獲得することである。
【0007】 恐らく音声符号器の設計において最も重要なことは、音声信号を記述するため
の良好な組のパラメータ(ベクトルを含む)を探索することである。良好な組の
パラメータは、知覚的に正確な音声信号の復元のために低いシステム帯域幅を必
要とする。ピッチ、信号パワー、スペクトル・エンベロープ(またはフォルマン
ト)、振幅スペクトル、及び位相スペクトルは、音声符号化パラメータの例であ
る。
【0008】 音声符号器は、時間域符号器として実施されてもよく、それは高い時間分解能
処理を使用して、一度に音声の小セグメント(典型的に5ミリ秒(ms)サブフ
レーム)を符号化することにより、時間域音声波形を獲得することを試みるもの
である。各サブフレームについて、コードブック・スペースからの高精度の標本
が、周知の種々の探索アルゴリズムを用いて、見い出される。代替として、音声
符号器は周波数域符号器として実施されてもよく、それは入力音声フレームの短
期音声スペクトルを1組のパラメータで獲得すること(解析)、及び、対応する
合成処理を使用してそのスペクトルパラメータから音声波形を作り直すことを試
みる。パラメータ量子化器は、A. Gersho及びR. M. Grayの“Vector Quantizati
on and Signal Compression(ベクトル量子化及び信号圧縮)”(1992年)に記
述された既知の量子化技術に従って、符号ベクトルの蓄積された代表でそれらを
表すことによりパラメータを保存する。
【0009】 周知の時間域音声符号器は、L. B. Rabiner及びR. W. Schaferの“Digital Pr
ocessing of Speech Signals(音声信号のディジタル処理)”396-453(1978年
)(これは、この引用により完全に本明細書中に組み込まれる)に記述された符
号励振線形予測(Code Excited Linear Predictive: CELP)符号器である。CE
LP符号器では、音声信号内の短期相関または冗長度は、線形予測(LP)解析
により取り除かれ、それは短期フォルマントフィルタの係数を見い出す。到来音
声フレームに短期予測フィルタを適用することはLP剰余(residue)信号を発
生し、それはさらにモデル化され、長期予測フィルタパラメータとその後の確率
コードブックで量子化される。このように、CELP符号化は時間域音声波形を
符号化するタスクを、LP短期フィルタ係数を符号化するタスクと、LP剰余を
符号化する別個のタスクとに分割する。時間域符号化は、固定レート(即ち、各
フレームについて、同数のビット、No、を使用して)で、または可変レート(
そこでは異なるタイプのフレーム内容について異なるビットレートが使用される
)で実行されることが可能である。可変レート符号器は、必要な量のビットのみ
を使用して、目標品質を得るのにふさわしいレベルにコーデック・パラメータを
符号化することを試みる。可変レートCELP符号器の一例が、本発明の譲受人
に譲渡された米国特許第5,414,796号に記述されており、これはこの引用により
完全に本明細書中に組み込まれる。
【0010】 CELP符号器のような時間域符号器は、時間域音声波形の精度を保つために
高いフレーム当たりビット数、No、を典型的にあてにする。そのような符号器
は、比較的大きい(例えば、8kbpsまたはそれ以上の)フレーム当たりビッ
ト数、No、を提供される優れた音声品質を典型的に実現する。しかしながら、
低ビットレート(4kbps及びそれ以下)では、時間域符号器は、限定された
利用可能ビット数により、高品質とエラーに強い性能とを保つことができない。
低ビットレートで、限定されたコードブックのスペースは、高レートの商業的応
用において非常に成功裡に展開されるところの従来の時間域符号器の波形整合能
力を縮小する。したがって、時間を掛けた改良にもかかわらず、低ビットレート
で動作している多くのCELP符号化システムは、典型的に雑音として特徴付け
られる知覚的に問題となる歪みに苦しんでいる。
【0011】 現在、中間から低いビットレート(即ち2.4から4kbps及びそれ以下の
レンジ)で動作する高品質音声符号器を開発する研究の興味のうねりと強い商業
的な需要とがある。その適用領域は、無線電話、衛星通信、インターネット電話
、種々のマルチメディアや音声ストリーム・アプリケーション、ボイスメール、
及び他の音声蓄積システムを含む。その推進力は、高い容量の必要性と、パケッ
トロス環境下でのエラーに強い性能の要求である。種々の最近の音声符号化の標
準化の努力が、低レート音声符号化アルゴリズムの研究開発を推進するもう1つ
の直接の推進力である。低レート音声符号器は、許容できる適用帯域幅ごとに、
より多くのチャネル即ちユーザを作り出し、そして適切なチャネル符号化の追加
レイヤと連結された低レート音声符号器は、符号器仕様の全ビットバジェットに
適合でき、そしてチャネルエラー状況下でエラーに強い性能を果たすことができ
る。
【0012】 音声を低ビットレートで効率的に符号化する1つの効果的な技術は、マルチモ
ード符号化である。このマルチモード符号化技術の一例は、“VARIABLE RATE SP
EECH CODING(可変レート音声符号化)”と題され、1998年12月21日に出願され
た、本発明の譲受人に譲渡された米国出願第09/217,341号に記述されており、こ
の引用によりそれは完全に本明細書中に組み込まれる。従前のマルチモード符号
器は、異なるタイプの入力音声フレームに、異なるモードまたは符号化−復号化
アルゴリズムを適用する。各モード即ち符号化−復号化処理は、例えば、音声通
話、非音声通話、(例えば、音声と非音声との間の)遷移通話、及び最も効率的
な方法における背景雑音(非音声)のような、あるタイプの音声セグメントを最
適に表示するためにカスタマイズされる。外部の、オープンループモード決定機
構は入力音声フレームを検査して、どちらのモードをフレームに適用するかに関
して決定を行う。オープンループモードの決定は、ある時間特性及びスペクトル
特性についてパラメータを評価し、そしてその評価におけるモード決定に基づい
て、入力フレームから幾つかのパラメータを抽出することにより典型的に行われ
る。
【0013】 2.4kbpsのオーダのレートで動作する符号化システムは、一般に性質に
おいてパラメトリックである。即ち、そのような符号化システムは、規則的なイ
ンターバルで音声信号のピッチ周期及びスペクトル・エンべロープ(またはフォ
ルマント)を記述しているパラメータを送信することにより動作する。これらの
いわゆるパラメートリック符号器の実例はLPボコーダシステムである。
【0014】 LPボコーダは、音声通話信号をピッチ周期当たりの単一パルスでモデル化す
る。この基礎技術は、特に、スペクトル・エンべロープについての送信情報を含
むよう増やされてもよい。LPボコーダは一般に合理的な性能を供給するが、そ
れらは典型的に騒音(buzz)として特徴付けられる、知覚的にかなりの歪みを誘
発する可能性がある。
【0015】 近年、符号器は、波形符号器とパラメトリック符号器との両者のハイブリッド
であることが明らかになった。これらのいわゆるハイブリッド符号器の実例はプ
ロトタイプ波形補間(PWI)音声符号システムである。PWI符号化システム
はまた、プロトタイプピッチ周期(PPP)音声符号器として知られることもで
きる。PWI符号化システムは、音声通話符号化用の効率的な方法を供給する。
PWIの基礎的な概念は、それの種類を送信するために、固定インターバルで代
表的なピッチサイクル(プロトタイプ波形)を抽出することであり、プロトタイ
プ波形間を補間することにより音声信号を復元することである。PWI方法は、
LP剰余信号上か音声信号上のいずれかで動作することができる。例示的なPW
IまたはPPP音声符号器は、本発明の譲受人に譲渡され、 “PERIODIC SPEECH
CODING(周期的音声符号化)”と題されて、1998年12月21日に出願された、米
国出願第09/217,494号に記述されており、この引用によりそれは完全に本明細書
中に組み込まれる。他のPWIまたはPPP音声符号器は、米国特許第5,884,25
3号、及びW. Bastiaan KleijnとWolfgang Granzowの“Methods for Waveform In
terpolation in Speech Coding, in 1 Digital Signal Processing(1ディジタ
ル信号処理において音声符号化内の波形補間のための方法)”215-230(1991年
)に記述されている。
【0016】 通話に埋め込まれたスペクトル情報が、特に音声通話において大きい知覚の重
要性を有することは周知である。プロトタイプ波形補間(PWI)符号器または
プロトタイプピッチ周期(PPP)符号器、マルチバンド励起(MBE)符号器
、及びシヌソイドの変換符号器(STC)のような多くの最高技術水準の音声符
号器は明白な符号化パラメータとしてスペクトル・マグニチュードを使用する。
しかしながら、そのようなスペクトル情報の効率的な符号化は、魅力的なタスク
であった。これは、主に1組の調波振幅により共通に表示されるスペクトルベク
トルが、推定されたピッチ周期に比例する大きさを有するからである。ピッチは
フレームからフレームまで一様でないので、振幅ベクトルの大きさは、その上変
化する。よって、可変ディメンションの入力ベクトルを処理するVQ法は、スペ
クトルベクトルを符号化するために必要である。にもかかわらず、(ビット及び
メモリの消費がより少ない)効果的な可変ディメンションVQ法は、まだ存在し
ない。
【0017】 当業者に周知のように、人間の耳の周波数分解能は、周波数の非線形関数(例
えば、メル・スケール(mel-scale) 及びバーク・スケール(bark scale))で
あり、そして人間の耳はより低周波数でよりもより高い周波数でスペクトルの詳
細に鋭敏ではない。人間の知覚に関するそのような知識が、効率的な振幅量子化
器の設計時に完全に明白であることは望ましい。
【0018】 従前の低ビットレート音声符号器では、振幅及び位相パラメータは個別に量子
化されて、各フレームの各プロトタイプに対して送信されてもよい。代替として
、パラメータを表示するために必要なビット数を減らすために、パラメータは直
接ベクトル量子化されてもよい。しかしながら、フレームパラメータを量子化す
るためのビットの必要数をさらに減らすことが望ましい。従って、音声信号また
は線形予測剰余信号の振幅スペクトルを知覚的に表示するために、効率的な量子
化スキームを提供することは有利である。このように、チャネル容量を高めるた
めに振幅スペクトルを低レートビットストリームで効率的に量子化する音声符号
器についての要望がある。
【0019】 発明の要約 本発明は、チャネル容量を高めるために振幅スペクトルを低レートビットスト
リームで効率的に量子化する音声符号器に向けられる。よって、この発明の1つ
の態様によれば、音声符号器内でスペクトル情報を量子化する方法は、好ましく
は、フレームから、ベクトルエネルギ値を有するスペクトル情報のベクトルを抽
出する工程と、複数の利得ファクタを発生するためにそのベクトルエネルギ値を
正規化する工程と、複数の利得ファクタを差動的にベクトル量子化する工程と、
複数の非均一な周波数帯のそれぞれに関連して複数の要素を有する固定ディメン
ションのベクトルを発生するために複数の正規化された利得ファクタを非均一に
ダウンサンプルする工程と、固定ディメンションのベクトルを複数のサブベクト
ルに分割する工程と、及び複数のサブベクトルを差動的に量子化する工程とを含
む。
【0020】 この発明の他の態様によれば、音声符号器は、好ましくは、フレームからスペ
クトル情報の、ベクトルエネルギ値を有するベクトルを抽出するための手段と、
複数の利得ファクタを発生するためにベクトルエネルギ値を正規化するための手
段と、複数の利得ファクタを差動的にベクトル量子化するための手段と、複数の
非均一な周波数帯のそれぞれに関連して複数の要素を有する固定ディメンション
のベクトルを発生するために複数の正規化された利得ファクタを非均一にダウン
サンプルするための手段と、固定ディメンションのベクトルを複数のサブベクト
ルに分割するための手段、及び複数のサブベクトルを差動的に量子化するための
手段とを含む。
【0021】 この発明の他の態様によれば、音声符号器は、好ましくは、フレームからスペ
クトル情報の、ベクトルエネルギ値を有するベクトルを抽出するよう構成された
抽出モジュールと、上記抽出モジュールと結合され、複数の利得ファクタを発生
するためにベクトルエネルギ値を正規化するよう構成された正規化モジュールと
、上記正規化モジュールと結合され、複数の利得ファクタを差動的にベクトル量
子化するよう構成された差動的ベクトル量子化モジュールと、上記正規化モジュ
ールと結合され、複数の非均一な周波数帯のそれぞれに関連して複数の要素を有
する固定ディメンションのベクトルを発生するために複数の正規化された利得フ
ァクタを非均一にダウンサンプルするよう構成されたダウンサンプラと、固定デ
ィメンションのベクトルを高域サブベクトルと低域サブベクトルとに分割するた
めの分割機構と、及び、上記分割機構と結合され、高域サブベクトルと低域サブ
ベクトルとを差動的に量子化するよう構成された差動的量子化モジュールとを含
む。
【0022】 好ましい実施形態の詳細な説明 以下に記述される例示的な実施形態は、CDMA大気中送信インターフェイス
を使用するために構成された無線電話通信システム内にある。それにもかかわら
ず、本発明の特徴を具体化しているサブサンプリング法及び装置が当業者に周知
の広範囲な技術を使用している種々の通信システムのいずれかに属する可能性が
あることは、当業者により理解されるであろう。
【0023】 図1に図示されるように、CDMA無線電話システムは、一般に、複数の移動
体加入者ユニット10、複数の基地局12、基地局コントローラ(BSC)14
、及び移動交換センタ(MSC)16を含む。MSC16は、従前の公衆交換電
話ネットワーク(PSTN)18とインターフェイスするよう構成される。MS
C16はまた、BSC14とインターフェイスするようにも構成されている。B
SC14は、迂回中継ラインにより基地局12と結合される。迂回中継ラインは
、例えば、E1/T1、ATM、IP、PPP、フレームリレー、HDSL、A
DSL、またはxDSLを含むいくつかの既知のインターフェイスのいずれかを
サポートするように構成されてもよい。このシステムには2つ以上のBSC14
があってもよいことが理解されるだろう。各基地局12は、好ましくは、少なく
とも1つのセクタ(図示せず)を含み、各セクタは全方向性アンテナまたは基地
局12から放射状に特定方向に指向されたアンテナを含んでいる。代替として、
各セクタは、ダイバーシティ受信用の2つのアンテナから成ってもよい。各基地
局12は、好ましくは、複数の周波数割当てをサポートするように設計されても
よい。セクタと周波数割当てとの交差点は、CDMAチャネルと呼ばれてもよい
。基地局12はまた、基地局トランシーバ・サブシステム(BTS)12として
知られてもよい。代替として、“基地局”は、工業ではBSC14及び1局また
はそれ以上のBTS12を集合的に引用するために使用されてもよい。BTS1
2はまた、“セルサイト”12と表されてもよい。代替として、与えられたBT
S12の個々のセクタがセルサイトと呼ばれてもよい。移動体加入者ユニット1
0は、典型的に、セルラまたはPCS電話機10である。システムは、好ましく
は、IS−95標準に従う使用のため構成される。
【0024】 セルラ電話システムの典型的な動作中、基地局12は移動体ユニット10の組
から逆方向リンク信号の組を受信する。移動体ユニット10は、電話呼または他
の通信を処理している。ある基地局12により受信された各逆方向リンク信号は
、その基地局12内で処理される。結果としてのデータは、BSC14に順方向
転送される。BSC14は、呼資源分配と、基地局12間のソフトハンドオフの
調和のとれた統合(orchestration)を含む移動度管理機能性(mobility manage
ment functionality)とを供給する。BSC14はまた、受信されたデータをM
SC16に送り、それはPSTN18とのインターフェイス用の追加のルーティ
ングサービスを供給する。同様に、PSTN18は、MSC16とインターフェ
イスし、そしてMSC16はBSC14とインターフェイスし、それは順方向リ
ンク信号の組を移動体ユニット10の組に送信するために順番に基地局12を制
御する。
【0025】 図2では第1の符号器100はディジタル化された音声サンプルs(n)を受
信し、第1の復号器104への送信メディア102即ち通信チャネル102上の
送信のためにサンプルs(n)を符号化する。復号器104は、符号化された音
声サンプルを復号し、そして出力音声信号sSYNTH(n)を合成する。反対方向
における送信については、第2の符号器106がディジタル化された音声サンプ
ルs(n)を符号化し、それは通信チャネル108上に送信される。第2の復号
器110は、符号化された音声サンプルを受信して復号し、合成された出力音声
信号sSYNTH(n)を発生する。
【0026】 音声サンプルs(n)は、ディジタル化され、例えば、パルス符号変調(PC
M)、圧伸μ法則、またはA法則を含む周知の種々の方法のいずれかに従って量
子化された音声信号を表す。周知のように、音声サンプルs(n)は、その中で
各フレームは所定数のディジタル化された音声サンプルs(n)から成る、入力
データのフレーム中に配列される。例示的な実施形態では、8kHzのサンプリ
ングレートが、160サンプルから成る各20msフレームで使用される。下記
の実施形態では、データ送信のレートは、好ましくは、フレーム対フレームベー
スで13.2kbps(全レート)から6.2kbps(半レート)、2.6k
bps(1/4レート)、1kbps(1/8レート)に変更されることができ
る。データ送信レートを変更することは、低ビットレートが比較的小さい音声情
報を含むフレームについて選択的に使用されてもよいので、好都合である。当業
者により理解されるように、他のサンプリングレート、フレームサイズ、及びデ
ータ送信レートが使用されてもよい。
【0027】 第1の符号器100と第2の復号器110とは共に、第1の音声符号器、即ち
音声コーデックである。音声符号器は、例えば、図1に関して上述された加入者
ユニット、BTSまたはBSCを含む音声信号送信用のいずれかの通信装置内で
使用されることができる。同様に、第2の符号器106と第1の復号器104と
は共に、第2の音声符号器から成る。音声符号器が、ディジタル信号プロセッサ
(DSP)、特定用途向け集積回路(ASIC)、個別ゲートロジック、ファー
ムウェア、またはいずれか従前のプログラム可能なソフトウェアモジュール及び
マイクロプロセッサで実施されてもよいことは、当業者により理解されるだろう
。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、レジスタ、ま
たは周知のいずれか他の形式の書き込み可能な蓄積媒体内に存する。代替として
、マイクロプロセッサに、いずれか従前のプロセッサ、コントローラ、またはス
テートマシーンが代用されることが可能である。音声符号化用に特別に設計され
た例示的なASICは、本発明の譲受人に譲渡され、この引用により完全に本明
細書中に組み込まれる、米国特許第5,727,123号、及び、本発明の譲受人に譲渡
され、この引用により完全に本明細書中に組み込まれる、“VOCODER ASIC(ボコ
ーダASIC)”と題され、1994年2月16日に出願された米国出願第08/197,417
号に記述されている。
【0028】 図3において、音声符号器内で使用されることができる符号器200は、モー
ド決定モジュール202、ピッチ推定モジュール204、LP解析モジュール2
06、LP解析フィルタ208、LP量子化モジュール210及び剰余量子化モ
ジュール212を含む。入力音声フレームs(n)は、モード決定モジュール2
02、ピッチ推定モジュール204、LP解析モジュール206及びLP解析フ
ィルタ208に供給される。モード決定モジュール202は、モードインデック
スIMと、各入力音声フレームs(n)の、周期性、エネルギ、信号対雑音比(
SNR)、または他の特徴の中の、ゼロ交差レートに基づいたモードMとを生成
する。周期性に従って音声フレームを分類する種々の方法は、本発明の譲受人に
譲渡された米国特許第5,911,128号に記述されており、この引用によりそれは完
全に本明細書中に組み込まれる。このような方法はまた、電気通信工業協会の工
業臨時標準TIA/EIA IS-127及びTIA/EIA IS-733にも組み込まれている。例示的な
モード決定スキームはまた、前述の米国出願第09/217,341号にも記述されている
【0029】 ピッチ推定モジュール204は、ピッチ・インデックスIPと各入力音声フレ
ームs(n)に基づいた遅延値Poとを生成する。LP解析モジュール206は
、各入力音声フレームs(n)上で線形予測解析を行ってLPパラメータaを発
生する。このLPパラメータaは、LP量子化モジュール210に供給される。
LP量子化モジュール210はまた、上記モードMを受信し、それによりモード
従属手法における量子化処理を実行する。LP量子化モジュール210は、LP
インデックスILPと量子化されたLPパラメータ
【数1】 とを生成する。LP解析フィルタ208は、入力音声フレームs(n)のほかに
上記量子化されたLPパラメータa^を受信する。LP解析フィルタ208は、
LP剰余信号R[n]を発生し、それは入力音声フレームs(n)と量子化され
た線形予測パラメータa^に基づいて復元された音声との間のエラーを表す。L
P剰余R[n]、モードM、及び量子化されたLPパラメータa^は、剰余量子
化モジュール212に供給される。これらの値に基づいて、剰余量子化モジュー
ル212は、剰余インデックスIRと量子化された剰余信号
【数2】 とを生成する。
【0030】 図4において、音声符号器内で使用されることかできる復号器300は、LP
パラメータ復号モジュール302、剰余復号モジュール304、モード復号モジ
ュール306、及びLP合成フィルタ308を含む。モード復号モジュール30
6は、モード・インデックスIMを受信して復号し、それからモードMを発生す
る。LPパラメータ復号モジュール302は、モードMとLPインデックスILP とを受信する。LPパラメータ復号モジュール302は、その受信値を復号して
、量子化されたLPパラメータa^を生成する。剰余復号モジュール304は、
剰余インデックスIR、ピッチ・インデックスIP、及びモード・インデックスI M を受信する。剰余復号モジュール304は、その受信値を復号して、量子化さ
れた剰余信号R^[n]を発生する。量子化された剰余信号R^[n]と量子化さ
れたLPパラメータa^とは、LP合成フィルタ308に供給され、そこではそ
れらから復号された出力音声信号
【数3】 を合成する。
【0031】 図3の符号器200及び図4の復号器300の種々のモジュールの動作及び具
体的構成は周知であり、そして前述の米国特許第5,414,796号と、L. B. Rabiner
及びR. W. Schaferkの“Digital Processing of Speech Signals(音声信号のデ
ィジタル処理)”396-453(1978年)とに記述されている。
【0032】 図5のフローチャートに図示されるように、一実施形態に従う音声符号器は、
送信用の音声サンプル処理内の1組のステップに追従する。ステップ400では
、音声符号器は、連続フレーム内の音声信号のディジタルサンプルを受信する。
あるフレームを受信して、音声符号器は、ステップ402に進む。このステップ
402では、音声符号器は、そのフレームのエネルギを検出する。このエネルギ
は、フレームの通話活動の尺度である。音声検出は、ディジタル化された音声サ
ンプルの振幅の2乗を合計し、その結果エネルギをしきい値と比較することによ
り実行される。一実施形態では、しきい値は背景雑音のレベル変更に基づいて適
合させる。例示的な可変しきい値の通話活動検出器は、前述の米国特許第5,414,
796号に記述されている。ある無声の通話音は、誤って背景雑音として符号化さ
れる可能性がある、極端に低エネルギのサンプルであることができる。これが起
こるのを防ぐために、前述の米国特許第5,414,796号に記述されているように、
低エネルギ・サンプルのスペクトル・チルトが無声の通話を背景雑音から区別す
るために使用されてもよい。
【0033】 フレームのエネルギを検出した後に、音声符号器は、ステップ404に進む。
このステップ404では、音声符号器は、検出されたフレームエネルギがフレー
ムを音声情報を含むものとして区別するのに十分かどうかを決定する。もし検出
されたフレームエネルギが事前に定義されたしきい値レベル以下に落ちると、音
声符号器は、ステップ406に進む。ステップ406では、音声符号器は、フレ
ームを背景雑音(即ち、非音声、または無音)として符号化する。一実施形態で
は、背景雑音フレームは1/8レート,または1kbpsで符号化される。もし
、上記ステップ404で、検出されたフレームエネルギが事前に定義されたしき
い値レベルを満足するかまたは超えると決定したときには、フレームは音声とし
て分類され、そして音声符号器は、ステップ408に進む。
【0034】 ステップ408では、音声符号器はフレームが無声の通話かどうかを決定し、
即ち、音声符号器は、フレームの周期性を調査する。周期性決定の種々の既知の
方法は、例えば、ゼロ交差の使用及び正規化自動相関関数(NACF)の使用を
含む。特に、周期性を検出するためにゼロ交差及びNACFを使用することは、
前述の米国特許第5,911,128号及び米国出願第09/217,341号に記述されている。
さらに、無声の通話から有声の通話を区別するために使用された上記の方法は、
電気通信工業協会の臨時標準TIA/EIA IS-127及びTIA/EIA IS-733に組み込まれて
いる。もしフレームが、このステップ408で無声通話であると決定されると、
音声符号器は、ステップ410に進む。ステップ410では、音声符号器は、フ
レームを無声通話として符号化する。一実施形態では、無声通話フレームは、1
/4レート、即ち2.6kbpsで符号化される。これに対し、上記ステップ4
08で、フレームが無声通話であると決定されない場合には、音声符号器は、ス
テップ412に進む。
【0035】 ステップ412では、例えば、前述の米国特許第5,911,128号に記述されるよ
うに、周知である周期性検出法を使用して、音声符号器はフレームが遷移音声で
あるかどうかを決定する。もし、フレームが遷移音声であると決定されると、音
声符号器は、ステップ414に進む。ステップ414では、フレームは遷移音声
(即ち、無声通話から有声通話への遷移)として符号化される。一実施形態では
、遷移音声フレームは、マルチパルス補間符号化法に従って符号化され、この符
号化法は、本発明の譲受人に譲渡され、“MULTIPULSE INTERPOLATIVE CODING OF
TRANSITION SPEECH FRAMES(遷移音声フレームのマルチパルス補間符号化)”
と題され、1999年5月7日に出願された、米国出願第09/307,294号に記述されてお
り、この引用によりそれは完全に本明細書中に組み込まれる。他の実施形態では
、遷移音声フレームは、全レート、即ち13.2kbpsで符号化される。
【0036】 もし、上記ステップ412で、音声符号器が、フレームは遷移音声ではないと
決定すると、音声符号器は、ステップ416に進む。このステップ416では、
音声符号器は、フレームを有声通話として符号化する。一実施形態では、有声通
話フレームは、半レート、即ち6.2kbpsで符号化されることができる。有
声通話フレームを全レート、即ち13.2kbps(または8k CELP符号
器における全レート、8kbps)で符号化することも可能である。しかしなが
ら、有声フレームを半レートで符号化することは、有声フレームの安定状態の性
質を利用することにより、符号器が貴重な帯域幅を節約できるようにすることを
、当業者は認めるであろう。その上、有声通話を符号化するために使用されるレ
ートには無関係に、有声通話は過去のフレームからの情報を使用して好適に符号
化され、そして今後予測的に符号化されると言われる。
【0037】 当業者は、音声信号か対応するLP剰余のどちらかが図5に示されたステップ
に従うことにより符号化できることを認めるであろう。雑音、無声、遷移及び有
声通話の波形特性は、図6(A)のグラフ内に時間の関数として見られることが
できる。雑音、無声、遷移及び有声LP剰余の波形特性は、図6(B)のグラフ
内に時間の関数として見られることができる。
【0038】 一実施形態では、音声符号器は、図7に図示されるように、送信、即ち符号器
セクションと、受信、即ち復号器セクションとを含む。符号器セクションは、有
声/無声分離モジュール1101と、ピッチ/スペクトル・エンベロープ量子化
器1102と、無声量子化モジュール1103と、振幅及び位相抽出モジュール
1104と、振幅量子化モジュール1105と、位相量子化モジュール1106
とを含む。復号器セクションは、振幅量子化解除モジュール1107と、位相量
子化解除モジュール1108と、無声量子化解除及び合成モジュール1109と
、有声セグメント合成モジュール1110と、音声/剰余合成モジュール111
1と、ピッチ/スペクトル・エンベロープ量子化解除器1112とを含む。音声
符号器は、好ましくはDSPの一部分として実施されてもよく、そして例えば、
PCS内の加入者ユニットまたは基地局内に、あるいは衛星システム内の加入者
ユニットまたはゲートウェイ内に存する。
【0039】 図7の音声符号器では、音声信号またはLP剰余信号は、好ましくは従前の有
声/無声分類器である、有声/無声分離モジュール1101の入力に供給される
。そのような分類器は、有声の及び無声の通話についての人間の知覚は実質的に
異なるので、好都合である。特に、無声の通話に埋め込まれた多量の情報は、人
間の耳には知覚的に無関係である。結果として、有声及び無声セグメントの振幅
スペクトルは、最大の符号化効率を達成するために別々に量子化されねばならな
い。本明細書中に記述された実施形態が有声の振幅スペクトルの量子化に向けら
れる一方で、本発明の特徴もまた無声の通話を量子化することに適用されてもよ
いことは注目されねばならない。
【0040】 ピッチ/スペクトル・エンベロープ量子化器1102は、図3の構成要素20
4、206及び210に関して記述された技術のような、従前の技術に従ってピ
ッチ及びスペクトル・エンベロープ情報を計算し、そして、その情報を復号器に
送信する。無声の部分は、無声量子化モジュール1103及び無声量子化解除モ
ジュール1109において従前の方法でそれぞれ符号化され及び復号化される。
これに反して、有声の部分は、まず振幅及び位相抽出用の振幅及び位相抽出モジ
ュール1104に送られる。そのような抽出手順は、当業者に知られる多数の従
前の方法において達成されることができる。例えば、振幅及び位相抽出の一つの
特定の方法は、米国特許第5,884,253号に記述されるように、プロトタイプ波形
補間である。この特定の方法では、各フレーム内の振幅及び位相は1ピッチ周期
の長さを有するプロトタイプ波形から抽出される。マルチバンド励振(MBE)
符号器及び調波音声符号器において使用されるもののような他の方法もまた、振
幅及び位相抽出モジュール1104により使用されてもよい。有声セグメント解
析モジュール1110は、この振幅及び位相抽出モジュール1104の逆の動作
を好適に実行する。
【0041】 位相量子化モジュール1106と位相量子化解除モジュール1108とは、従
前の様式において好適に実施されてもよい。図8乃至図10を参照した下記の記
述は、振幅量子化モジュール1105及び振幅量子化解除モジュール1107を
非常に詳細に記述するのに役立つ。
【0042】 1.エネルギ正規化 図8に示されるように、一実施形態に従う振幅量子化モジュールは、帯域エネ
ルギ正規化器1301、パワー差動量子化器1302、非均一スペクトル・ダウ
ンサンプラ1303、低帯域振幅差動量子化器1304、高帯域振幅差動量子化
器1305、低帯域振幅差動量子化解除器1306、高帯域振幅差動量子化解除
器1307、パワー差動量子化解除器1308、及び調波クローニング・モジュ
ール1309(図面の明解化のため2つ示されている)を含む。4つのユニット
遅延要素もまた振幅量子化モジュール内に含まれる。図9に示されるように、一
実施形態に従う振幅量子化解除モジュールは、低帯域振幅差動量子化解除器14
01、高帯域振幅差動量子化解除器1402、スペクトル積分器1403、非均
一スペクトル・アップサンプラ1404、帯域エネルギ正規化解除器1405、
パワー差動量子化解除器1406、及び調波クローニング・モジュール1407
(図面の明解化のため2つ示されている)を含む。4つのユニット遅延要素もま
た振幅量子化解除モジュール内に含まれる。
【0043】 振幅量子化処理における第1のステップは、帯域エネルギ正規化器1301に
おいて演算された利得正規化ファクタを決定することである。典型的に、振幅ス
ペクトルが最初に正規化されるときはいつでも、振幅スペクトルの形状は低帯域
振幅差動量子化器1304及び高帯域振幅差動量子化器1305内でより効率的
に符号化されることができる。帯域エネルギ正規化器1301では、エネルギ正
規化は低帯域内及び高帯域内で別々に行われる。正規化されないスペクトル({
k}と表示)と正規化されたスペクトル(
【数4】 と表示)との間の関係は2つの利得ファクタの用語α及びβで表現される。明確
には、
【数5】 ここで
【数6】 1は低帯域に対応する一組の調波数を表し、そしてK2は高帯域に対応する一組
の調波数を表す。低帯域と高帯域とを区切っている境界は、実例となる実施形態
では、好ましくは1104Hzであるように選ばれる。(以下に記述されるよう
に、この特定の周波数点は、図10に示されるように、実際に帯域#11の右端
に相当する。図11(B)のグラフは正規化された振幅スペクトルの一例を示す
。原振幅スペクトルは、図11(A)のグラフに示される。
【0044】 2.非均一スペクトル・ダウンサンプリング 帯域エネルギ正規化器1301により発生された正規化されたスペクトル{A
~k}は非均一スペクトル・ダウンサンプラ1303に供給され、その動作は図1
0に示されるように1組の所定の非均一帯域に基礎を置く。全周波数レンジには
好都合に22の非均一帯域(周波数ビンとしても知られる)があり、そのビン端
は周波数目盛り(Hz)上の固定点に相当する。最初の8帯域のサイズは好まし
くは約95Hzに固定され、これに反して残りの帯域のサイズは周波数で対数的
に増加する。帯域数及び帯域サイズは本明細書中に記述された実施形態に限定さ
れる必要はなく、そして本発明の基礎をなす原理から逸脱すること無しに変更さ
れてもよいことは理解されるべきである。
【0045】 ダウンサンプリング処理は下記のように働く。各調波
【数7】 はまず周波数ビンに関連する。その後、各ビン内の調波の平均マグニチュードが
計算される。結果としてのスペクトルは、B(i)(但し、i=1,2,…,2
2)で示された22のスペクトル値のベクトルとなる。あるビン、特に小遅延値
について、は空きであってもよいことは注意されるべきである。スペクトル内の
調波の数は基本周波数次第である。典型的な音声符号化システムにおける最小の
容認できるピッチ値は好ましくは、(8kHzのサンプリング周波数を仮定して
)20に設定され、それは11調波のみに相当する。それゆえ、空きのビンは避
けられない。
【0046】 コードブック設計及び空きのビンの存在における探索を容易にするために、ビ
ンウェイトと呼ばれるパラメータW(i)(但し、i=1,2,…,22)が空
きのビンの位置の追尾を維持するために示される。パラメータW(i)は好まし
くは空きのビンに対してはゼロに、使用中のビンに対しては1に設定される。こ
のビンウェイト情報は、コードブック探索中及びトレーニング中は空きのビンを
捨てるように従前のVQルーチンにおいて使用され得る。{W(i)}が基本周
波数のみの関数であることは注意されねばならない。したがって、どのビンウェ
イト情報も復号器に送信される必要はない。
【0047】 非均一ダウンサンプラ1303は2つの重要な目的に役立つ。第1に、可変デ
ィメンションの振幅ベクトルは、対応するビンウェイトを持つ固定ディメンショ
ンのベクトルにマップされる。このように、従前のVQ技術はダウンサンプルさ
れたベクトルを量子化するために適用可能である。第2に、非均一ビンアプロー
チは、人間の耳が(バーク目盛りと同様に)周波数目盛りの非線形関数であると
ころの周波数分解能を有するという事実を利用する。ほとんどの知覚的に関係の
ない情報は、符号化の効率を高めるためにダウンサンプリング処理の間に捨てら
れる。
【0048】 3.利得ファクタの量子化 周知のように、信号パワーの対数はその信号パワー自身よりも知覚的に多くの
関連がある。このように、2つの利得ファクタα及びβの量子化は、対数領域内
において差動法で実行される。チャネルエラーのために、少量の漏洩を差動量子
化器に注入することは有利である。このようにα及びβはパワー差動量子化器1
302とパワー差動量子化解除器1308とにより、下記の式に従ってそれぞれ
量子化及び量子化解除されることができる:
【数8】 ここでN−1及びNは2つの連続する抽出された利得ファクタの時期を示し、そ
してQ(・)は差動量子化演算を表す。パラメータρはチャネルエラーの不確定
な伝播を防ぐために漏洩ファクタとして機能する。典型的な音声符号化システム
では、値ρは0.6と0.99との間に分布する。上記の式は自己回帰(AR)
処理を例示する。同様に、移動平均(MA)スキームはまたチャネルエラーへの
感受性を減らすために適用されてもよい。AR処理とは異なり、エラー伝播はM
Aスキームにおける非巡回復号器構造により制限されない。
【0049】 サイズが64または128のコードブックはα及びβを優秀な品質で量子化す
るのに十分である。結果としてのコードブック・インデックスIpowerは復号器
に送信される。図9も参照して、復号器でのパワー差動量子化解除器1406は
符号器でのパワー差動量子化解除器1308と好適に同一であり、そして復号器
での帯域エネルギ正規化解除器1405は好適に符号器での帯域エネルギ正規化
器1301と逆の動作を行う。
【0050】 3.スペクトル形状の量子化 スペクトル・ダウンサンプリングが非均一スペクトル・ダウンサンプラ130
1により実行された後で、{B(i)}は量子化されるのに先立って2組に分割
される。低帯域{B(i=1,2,…,11)}は低帯域振幅差動量子化器13
04に供給される。高帯域{B(i=12,…,22)}は高帯域振幅差動量子
化器1305に供給される。高帯域及び低帯域は差動法においてそれぞれ量子化
される。差動ベクトルは下記の式に従って計算される:
【数9】 ここで
【数10】 は以前のベクトルの量子化バージョンを表す。2つの対応する重みベクトル間に
不一致がある(即ち、以前と今のスペクトルとの間の遅延不一致により引き起こ
される、WN≠WN-1の)とき、結果としてのΔBNは量子化器の性能を下げる誤
った値を含む可能性がある。例えば、もし以前の遅延Lprevが43であり、今の
遅延Lcurrが44であると、図10に示された割り当てスキームに従って計算さ
れた対応する重みベクトルは下記のようであるだろう: WN-1={0,0,1,0,1,0,1,1,0,1,…} WN ={0,1,0,1,0,1,0,1,0、1,…} この場合に、誤った値はΔBN(i)内のi=2,4,6で生起するであろうし
、ここで下記のブーリアン式は真である:
【数11】 他の種類の不整合、この例においてはi=3,5,7で生起する
【数12】 が、量子化器性能に影響を及ぼさないであろうことは注意されねばならない。こ
れらのビンはとにかくゼロウェイトを有する(即ち、WN(i)=0)ので、こ
れらのビンは従前の重み付け探索手順では自動的に無視されるであろう。
【0051】 一実施形態では、調波クローニングを示された技術が不整合な重みベクトルを
処理するために使用される。調波クローニング技術は、ΔBNを計算する前に、
【数13】 内のすべての空きのビンが調波により一時的に満たされるので、
【数14】 を{B^N-1’}に修正する。もしLprev<Lcurrならば、調波は右側隣からクロ
ーンされる。もしLprev>Lcurrならば、調波は左側隣からクローンされる。調
波クローニング処理は以下の例により説明される。{B^N-1}が第1の4つの空
きでないビンについてスペクトル値W,X,Y,Z,…を有すると仮定されたい
。上記(Lprev=43及びLcurr=44)と同じ例を使用して、{B^N-1’}は
(Lprev<Lcurrであるので)右側隣からのクローニングにより計算されること
ができる:
【数15】 ここで0は空きのビンを意味する。もしベクトルBNが BN={0,A,0,B,0,C,0,D,0,…} ならばそのとき、 ΔBN={0,A−W,0,B−X,0,C−Y,0,D−Z,0,…} 調波クローニングは符号器及び復号器の両者で、明確には調波クローニング・
モジュール1309,1407内で実施される。利得量子化器1302の場合と
同様の様式では、漏洩ファクタρはチャネルエラーの存在において不確定なエラ
ー伝播を防ぐためにスペクトル量子化に適用されることができる。例えば、ΔB N
【数16】 により得られることができる。また、よりよい性能を得るために、低帯域振幅差
動量子化器1304及び高帯域振幅差動量子化器1305は、CELP符号器内
で剰余信号を量子化するために伝統的に使用されたと同様な方法におけるエラー
基準の計算に、スペクトル重み付けを使用してもよい。
【0052】 インデックスIamp1及びIamp2は復号器に送信される低帯域及び高帯域コード
ブック・インデックスである。特定の実施形態では、両振幅差動量子化器130
4,1305はトール・クォリティ出力を達成するために総計で約12ビット(
600bps)を必要とする。
【0053】 復号器で、非均一スペクトル・アップサンプラ1401は、22スペクトル値
をそれらの原ディメンション(ベクトル内の要素数をダウンサンプリングでは2
2に変更し、そしてアップサンプリングでは元の数に戻す)にアップサンプルす
る。計算の複雑性をあまり増加させること無しに、そのようなアップサンプリン
グは従前の線形補間技術により実行されることができる。図11(A)〜(C)
のグラフはアップサンプルされたスペクトルを例示している。復号器での低帯域
振幅差動量子化解除器1401及び高帯域振幅差動量子化解除器1402は、符
号器でのそれらのそれぞれの相対物の、低帯域振幅差動量子化解除器1306及
び高帯域振幅差動量子化解除器1307と好適に同じであることは注意されねば
ならない。
【0054】 上記の実施形態は人間の耳の非線形周波数分解能を完全に利用する新規な振幅
量子化技術を開発し、そして同時に可変ディメンションVQの使用を軽減する。
本発明の特徴を具体化している符号化技術は、(量子化されない位相スペクトル
付きの)トール・クォリティ出力を達成するためにプロトタイプ波形の振幅スペ
クトルを表すべき18ビット/フレーム(900bps)ほど少なく要求して、
PWI音声符号化システムに成功裡に適用された。当業者は本発明の特徴を具体
化している量子化技術はいかなる形式のスペクトル情報にも適用されることがで
き、そして振幅スペクトル情報に限定される必要がないことを容易に認めるであ
ろう。当業者がさらに認めるであろうように、本発明の原理はPWI音声符号化
システムには限定されないが、しかし明白な符号化パラメータとして、例えば、
MBE及びSTCのような振幅スペクトルを有する多くの他の音声符号化アルゴ
リズムにも適用可能である。
【0055】 多くの特定の実施形態が示されそして本明細書中に記述された一方で、これら
の実施形態は本発明の原理の適用において考案されることができる多くの実行可
能な特定の装置の実例に過ぎないことは、理解されることである。多数の変更さ
れた他の装置が、この発明の精神及び範囲を逸脱すること無しに当業者によりこ
れらの原理に従って考案されることは可能である。例えば、図10に示された非
均一帯域表示内の帯域端(またはビンサイズ)の僅かな変更は、結果としての音
声品質に有意な影響を生じる可能性はない。また、図8に示された低帯域振幅差
動量子化器及び高帯域振幅差動量子化器において低及び高帯域スペクトルを分割
する区切り周波数(一実施形態では、1104Hzに設定される)は、結果とし
ての知覚の品質に多くの影響無しに変更されることができる。さらに、上記実施
形態は音声または剰余信号内の振幅の符号化での使用方法を指示したが、本発明
の技術はまたオーディオ信号の符号化に適用されてもよいことは当業者には明白
であるだろう。
【0056】 このように、低ビットレート音声符号器用の新規な振幅量子化スキームが記述
された。当業者は、種々の図示された論理ブロック及び本明細書中に開示された
実施形態に関連して記述されたアルゴリズムのステップは、ディジタル信号プロ
セッサ(DSP)や、特定用途向け集積回路(ASIC)や、個別ゲートまたは
トランジスタロジックや、例えばレジスタ及びFIFO,1組のファームウェア
命令を実行するプロセッサのような個別のハードウェア構成部品、またはいずれ
かの従前のプログラム可能なソフトウェアモジュール及びプロセッサ、と共に実
施されまたは実行されてもよいことを、理解するであろう。プロセッサは好都合
にマイクロプロセッサであってもよいが、しかし代替では、プロセッサはいかな
る従前のプロセッサや、コントローラや、マイクロコントローラまたはステート
マシンであってもよい。ソフトウェアモジュールはRAMメモリや、フラシュメ
モリや、レジスタまたは周知のいずれか他の形式の書き込み可能な蓄積媒体内に
存することができる。当業者はさらに、上記記述の全体を通して参照される可能
性のあるデータ,命令,コマンド,情報,信号,ビット,シンボル及びチップは
、電圧,電流,電磁波,磁界または磁気粒子,光フィールドまたは光粒子,ある
いはそれらのいずれかの組み合わせにより好適に表されることを、認めるであろ
う。
【0057】 本発明の好ましい実施形態はこのように示されそして記述された。しかしなが
ら、多くの変更がこの発明の精神及び範囲から逸脱すること無しに本明細書中の
実施形態になされてもよいことは、当業者には明白であるだろう。したがって、
本発明はその請求の範囲に従う以外に限定されることはない。
【図面の簡単な説明】
【図1】 無線電話システムのブロック図である。
【図2】 音声符号器により各端で終端される通信チャネルのブロック図である。
【図3】 符号器のブロック図である。
【図4】 復号器のブロック図である。
【図5】 音声符号化決定処理を図示するフローチャートである。
【図6】 (A)は音声信号振幅対時間のグラフであり、(B)は線形予測(LP)剰余
振幅対時間のグラフである。
【図7】 符号化パラメータとして振幅スペクトルを有する音声符号器のブロック図であ
る。
【図8】 図7の音声符号器内で使用されることができる振幅量子化モジュールのブロッ
ク図である。
【図9】 図7の音声符号器内で使用されることができる振幅量子化解除モジュールのブ
ロック図である。
【図10】 図8の振幅量子化モジュール内のスペクトル・ダウンサンプラにより、または
図9の振幅アップサンプラ内のスペクトル・アップサンプラにより実行されるこ
とができる非均一帯域の仕切りを示す図である。
【図11】 (A)は残留信号振幅スペクトル対周波数軸が図9の仕切りに従って仕切られ
る周波数のグラフ、(B)は(A)のエネルギ正規化スペクトルのグラフであり
、(C)は(B)の非均一ダウンサンプルされた及び線形アップサンプルされた
スペクトルのグラフである。
【符号の説明】
1101 有声/無声分離モジュール 1102 ピッチ/スペクトル・エンベロープ量子化器 1103 無声量子化モジュール 1104 振幅及び位相抽出モジュール 1105 振幅量子化モジュール 1106 位相量子化モジュール 1107 振幅量子化解除モジュール 1108 位相量子化解除モジュール 1109 無声量子化解除及び合成モジュール 1110 有声セグメント合成モジュール 1111 音声/剰余合成モジュール 1112 ピッチ/スペクトル・エンベロープ量子化解除器 1301 帯域エネルギ正規化器 1302 パワー差動量子化器 1303 非均一スペクトル・ダウンサンプラ 1304 低帯域振幅差動量子化器 1305 高帯域振幅差動量子化器 1306 低帯域振幅差動量子化解除器 1307 高帯域振幅差動量子化解除器 1308 パワー差動量子化解除器 1309 調波クローニング・モジュール 1401 低帯域振幅差動量子化解除器 1402 高帯域振幅差動量子化解除器 1403 スペクトル積分器 1404 非均一スペクトル・アップサンプラ 1405 帯域エネルギ正規化解除器 1406 パワー差動量子化解除器 1407 調波クローニング・モジュール
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 7/04 G (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AG,AL,AM,AT, AU,AZ,BA,BB,BG,BR,BY,BZ,C A,CH,CN,CR,CU,CZ,DE,DK,DM ,DZ,EE,ES,FI,GB,GD,GE,GH, GM,HR,HU,ID,IL,IN,IS,JP,K E,KG,KP,KR,KZ,LC,LK,LR,LS ,LT,LU,LV,MA,MD,MG,MK,MN, MW,MX,MZ,NO,NZ,PL,PT,RO,R U,SD,SE,SG,SI,SK,SL,TJ,TM ,TR,TT,TZ,UA,UG,UZ,VN,YU, ZA,ZW (72)発明者 マンジュナス、シャラス アメリカ合衆国、カリフォルニア州 92126 サン・ディエゴ、ナンバー5、シ リング・アベニュー 7104 Fターム(参考) 5D045 DA01 DA11 DA20 5J064 AA02 BA13 BC01 BC03 BC10 BC11 BC16 BC18 BD02 5K050 AA01 BB01 BB18 FF13 FF14

Claims (45)

    【特許請求の範囲】
  1. 【請求項1】 下記工程を具備する、音声符号器内でスペクトル情報を量子
    化する方法: フレームからスペクトル情報の、ベクトルエネルギ値を有するベクトルを抽出
    する; 複数の利得ファクタを発生するために上記ベクトルエネルギ値を正規化する; 上記複数の利得ファクタを差動的にベクトル量子化する; 複数の非均一な周波数帯のそれぞれに関連して複数の要素を有する固定ディメ
    ンションのベクトルを発生するために上記複数の正規化された利得ファクタを非
    均一にダウンサンプルする; 上記固定ディメンションのベクトルを複数のサブベクトルに分割する;及び 上記複数のサブベクトルを差動的に量子化する。
  2. 【請求項2】 空きの周波数帯に対応する要素の位置を追尾するために周波
    数帯重みベクトルを形成するための工程をさらに具備する、請求項1の方法。
  3. 【請求項3】 上記抽出工程は、振幅スペクトル情報のベクトルを抽出する
    ことを具備する、請求項1の方法。
  4. 【請求項4】 上記フレームは、音声フレームである、請求項1の方法。
  5. 【請求項5】 上記フレームは、線形予測剰余フレームである、請求項1の
    方法。
  6. 【請求項6】 上記正規化工程は、2つの利得ファクタを発生するためにサ
    ブバンドの2つを使用して上記ベクトルエネルギ値を正規化することを具備する
    、請求項1の方法。
  7. 【請求項7】 上記差動的にベクトル量子化する工程は、対数領域で実行さ
    れる、請求項1の方法。
  8. 【請求項8】 上記差動的にベクトル量子化する工程は、チャネルエラーの
    不確定な伝播を防ぐために量子化の間の漏洩を最小にする工程をさらに具備する
    、請求項1の方法。
  9. 【請求項9】 上記複数の非均一周波数帯は、22の非均一周波数帯を具備
    する、請求項1の方法。
  10. 【請求項10】 上記非均一にダウンサンプルする工程は、複数の調波を複
    数の非均一周波数帯と関連付けする工程と、各周波数帯内の上記調波の平均マグ
    ニチュードを計算する工程とを具備し、且つ、上記固定ディメンションのベクト
    ルの上記要素は、各周波数帯のための平均の調波マグニチュード値である、請求
    項1の方法。
  11. 【請求項11】 上記差動的に量子化する工程は、調波クローニングを具備
    する、請求項1の方法。
  12. 【請求項12】 上記差動的に量子化する工程は、チャネルエラーの不確定
    な伝播を防ぐために量子化の間の漏洩を最小にする工程をさらに具備する、請求
    項1の方法。
  13. 【請求項13】 上記差動的に量子化する工程は、スペクトル重み付け技術
    でエラー基準を計算する工程をさらに具備する、請求項1の方法。
  14. 【請求項14】 複数の復号された利得ファクタを発生するために上記複数
    の利得ファクタを復号する工程と、復号され正規化されたスペクトル情報を発生
    するために上記差動的に量子化する工程の結果としての量子化された値を復号す
    る工程と、上記復号され正規化されたスペクトル情報をアップサンプルする工程
    と、及び、上記アップサンプルされ復号され正規化されたスペクトル情報を上記
    複数の復号された利得ファクタで正規化解除する工程とをさらに具備する、請求
    項1の方法。
  15. 【請求項15】 上記音声符号器は、無線通信システムの加入者ユニット内
    に存する、請求項1の方法。
  16. 【請求項16】 下記を具備する、音声符号器: フレームからスペクトル情報の、ベクトルエネルギ値を有するベクトルを抽出
    するための手段; 複数の利得ファクタを発生するために上記ベクトルエネルギ値を正規化するた
    めの手段; 上記複数の利得ファクタを差動的にベクトル量子化するための手段; 複数の非均一な周波数帯のそれぞれに関連して複数の要素を有する固定ディメ
    ンションのベクトルを発生するために上記複数の正規化された利得ファクタを非
    均一にダウンサンプルするための手段; 上記固定ディメンションのベクトルを複数のサブベクトルに分割するための手
    段;及び 上記複数のサブベクトルを差動的に量子化するための手段。
  17. 【請求項17】 空きの周波数帯に対応する要素の位置を追尾するために周
    波数帯重みベクトルを形成するための手段をさらに具備する、請求項16の音声
    符号器。
  18. 【請求項18】 上記抽出するための手段は、振幅スペクトル情報のベクト
    ルを抽出するための手段を具備する、請求項16の音声符号器。
  19. 【請求項19】 上記フレームは、音声フレームである、請求項16の音声
    符号器。
  20. 【請求項20】 上記フレームは、線形予測剰余フレームである、請求項1
    6の音声符号器。
  21. 【請求項21】 上記正規化するための手段は、2つの利得ファクタを発生
    するためにサブバンドの2つを使用して上記ベクトルエネルギ値を正規化するた
    めの手段を具備する、請求項16の音声符号器。
  22. 【請求項22】 上記差動的にベクトル量子化するための手段は、対数領域
    で差動的にベクトル量子化するための手段を具備する、請求項16の音声符号器
  23. 【請求項23】 上記差動的にベクトル量子化するための手段は、チャネル
    エラーの不確定な伝播を防ぐために量子化の間の漏洩を最小にするための手段を
    さらに具備する、請求項16の音声符号器。
  24. 【請求項24】 上記複数の非均一周波数帯は、22の非均一周波数帯を具
    備する、請求項16の音声符号器。
  25. 【請求項25】 上記非均一にダウンサンプルするための手段は、複数の調
    波を複数の非均一周波数帯と関連付けするための手段と、及び各周波数帯内の上
    記調波の平均マグニチュードを計算するための手段とを具備し、且つ、上記固定
    ディメンションのベクトルの上記要素は、各周波数帯のための平均の調波マグニ
    チュード値である、請求項16の音声符号器。
  26. 【請求項26】 上記差動的に量子化するための手段は、調波クローニング
    を行うための手段を具備する、請求項16の音声符号器。
  27. 【請求項27】 上記差動的に量子化するための手段は、チャネルエラーの
    不確定な伝播を防ぐために量子化の間の漏洩を最小にするための手段をさらに具
    備する、請求項16の音声符号器。
  28. 【請求項28】 上記差動的に量子化するための手段は、スペクトル重み付
    け技術でエラー基準を計算するための手段をさらに具備する、請求項16の音声
    符号器。
  29. 【請求項29】 複数の復号された利得ファクタを発生するために上記複数
    の利得ファクタを復号し、且つ復号され正規化されたスペクトル情報を発生する
    ために上記差動的に量子化するための手段により発生された量子化された値を復
    号するための手段と、上記復号され正規化されたスペクトル情報をアップサンプ
    ルするための手段と、及び上記アップサンプルされ復号され正規化されたスペク
    トル情報を上記複数の復号された利得ファクタで正規化解除するための手段とを
    さらに具備する、請求項16の音声符号器。
  30. 【請求項30】 上記音声符号器は、無線通信システムの加入者ユニット内
    に存する、請求項16の音声符号器。
  31. 【請求項31】 下記を具備する、音声符号器: フレームからスペクトル情報の、ベクトルエネルギ値を有するベクトルを抽出
    するよう構成された抽出モジュール; 上記抽出モジュールと結合され、複数の利得ファクタを発生するために上記ベ
    クトルエネルギ値を正規化するよう構成された正規化モジュール; 上記正規化モジュールと結合され、上記複数の利得ファクタを差動的にベクト
    ル量子化するよう構成された差動的ベクトル量子化モジュール; 上記正規化モジュールと結合され、複数の非均一な周波数帯のそれぞれに関連
    して複数の要素を有する固定ディメンションのベクトルを発生するために上記複
    数の正規化された利得ファクタを非均一にダウンサンプルするよう構成されたダ
    ウンサンプラ; 上記固定ディメンションのベクトルを高帯域サブベクトルと低帯域サブベクト
    ルとに分割するための分割機構;及び 上記分割機構と結合され、上記高帯域サブベクトルと低帯域サブベクトルとを
    差動的に量子化するよう構成された差動的量子化モジュール。
  32. 【請求項32】 空きの周波数帯に対応する要素の位置を追尾するために周
    波数帯重みベクトルを形成するためのモジュールをさらに具備する、請求項31
    の音声符号器。
  33. 【請求項33】 上記抽出モジュールは、振幅スペクトル情報のベクトルを
    抽出するために構成される、請求項31の音声符号器。
  34. 【請求項34】 上記フレームは、音声フレームである、請求項31の音声
    符号器。
  35. 【請求項35】 上記フレームは、線形予測剰余フレームである、請求項3
    1の音声符号器。
  36. 【請求項36】 上記正規化モジュールは、2つの利得ファクタを発生する
    ためにサブバンドの2つを使用して上記ベクトルエネルギ値を正規化するよう構
    成される、請求項31の音声符号器。
  37. 【請求項37】 上記差動的ベクトル量子化モジュールは、対数領域で差動
    的にベクトル量子化するよう構成される、請求項31の音声符号器。
  38. 【請求項38】 上記差動的ベクトル量子化モジュールは、チャネルエラー
    の不確定な伝播を防ぐために量子化の間の漏洩を最小にするようさらに構成され
    る、請求項31の音声符号器。
  39. 【請求項39】 上記複数の非均一周波数帯は、22の非均一周波数帯を具
    備する、請求項31の音声符号器。
  40. 【請求項40】 上記ダウンサンプラは、複数の調波を複数の非均一周波数
    帯と関連付けし、各周波数帯内の上記調波の平均マグニチュードを計算するよう
    構成され、且つ、上記固定ディメンションのベクトルの上記要素は、各周波数帯
    のための平均の調波マグニチュード値である、請求項31の音声符号器。
  41. 【請求項41】 上記差動的量子化モジュールは、調波クローニングを行う
    よう構成される、請求項31の音声符号器。
  42. 【請求項42】 上記差動的量子化モジュールは、チャネルエラーの不確定
    な伝播を防ぐために量子化の間の漏洩を最小にするようさらに構成される、請求
    項31の音声符号器。
  43. 【請求項43】 上記差動的量子化モジュールは、スペクトル重み付け技術
    でエラー基準を計算するようさらに構成される、請求項31の音声符号器。
  44. 【請求項44】 複数の復号された利得ファクタを発生するために上記複数
    の利得ファクタを復号し、且つ復号され正規化されたスペクトル情報を発生する
    ために差動的量子化モジュールにより発生された量子化された値を復号するよう
    構成された復号器と、上記復号器と結合され、上記復号され正規化されたスペク
    トル情報をアップサンプルするよう構成されたアップサンプラと、及び上記アッ
    プサンプラと結合され、上記アップサンプルされ復号され正規化されたスペクト
    ル情報を上記複数の復号された利得ファクタで正規化解除するよう構成された正
    規化解除器とをさらに具備する、請求項31の音声符号器。
  45. 【請求項45】 上記音声符号器は、無線通信システムの加入者ユニット内
    に存する、請求項31の音声符号器。
JP2001511668A 1999-07-19 2000-07-18 音声符号器用のスペクトル・マグニチュード量子化 Expired - Lifetime JP4659314B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/356,756 1999-07-19
US09/356,756 US6324505B1 (en) 1999-07-19 1999-07-19 Amplitude quantization scheme for low-bit-rate speech coders
PCT/US2000/019602 WO2001006493A1 (en) 1999-07-19 2000-07-18 Spectral magnitude quantization for a speech coder

Publications (3)

Publication Number Publication Date
JP2003505724A true JP2003505724A (ja) 2003-02-12
JP2003505724A5 JP2003505724A5 (ja) 2007-09-13
JP4659314B2 JP4659314B2 (ja) 2011-03-30

Family

ID=23402824

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001511668A Expired - Lifetime JP4659314B2 (ja) 1999-07-19 2000-07-18 音声符号器用のスペクトル・マグニチュード量子化

Country Status (13)

Country Link
US (1) US6324505B1 (ja)
EP (1) EP1204969B1 (ja)
JP (1) JP4659314B2 (ja)
KR (2) KR100898324B1 (ja)
CN (1) CN1158647C (ja)
AT (1) ATE324653T1 (ja)
AU (1) AU6353600A (ja)
BR (1) BRPI0012542B1 (ja)
CY (1) CY1106119T1 (ja)
DE (1) DE60027573T2 (ja)
ES (1) ES2265958T3 (ja)
HK (1) HK1047817A1 (ja)
WO (1) WO2001006493A1 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6456964B2 (en) * 1998-12-21 2002-09-24 Qualcomm, Incorporated Encoding of periodic speech using prototype waveforms
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
AU4072400A (en) * 1999-04-05 2000-10-23 Hughes Electronics Corporation A voicing measure as an estimate of signal periodicity for frequency domain interpolative speech codec system
KR100434538B1 (ko) * 1999-11-17 2004-06-05 삼성전자주식회사 음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의음성 합성 방법
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
GB0005515D0 (en) * 2000-03-08 2000-04-26 Univ Glasgow Improved vector quantization of images
ATE420432T1 (de) * 2000-04-24 2009-01-15 Qualcomm Inc Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen
US6937979B2 (en) * 2000-09-15 2005-08-30 Mindspeed Technologies, Inc. Coding based on spectral content of a speech signal
US6947888B1 (en) * 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
US6996523B1 (en) * 2001-02-13 2006-02-07 Hughes Electronics Corporation Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
US20050234712A1 (en) * 2001-05-28 2005-10-20 Yongqiang Dong Providing shorter uniform frame lengths in dynamic time warping for voice conversion
KR100841096B1 (ko) * 2002-10-14 2008-06-25 리얼네트웍스아시아퍼시픽 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
US7272557B2 (en) * 2003-05-01 2007-09-18 Microsoft Corporation Method and apparatus for quantizing model parameters
EP3118849B1 (en) * 2004-05-19 2020-01-01 Fraunhofer Gesellschaft zur Förderung der Angewand Encoding device, decoding device, and method thereof
EP1814438B8 (en) * 2004-11-08 2009-04-01 Koninklijke Philips Electronics N.V. Safe identification and association of wireless sensors
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
TWI358056B (en) * 2005-12-02 2012-02-11 Qualcomm Inc Systems, methods, and apparatus for frequency-doma
KR101244310B1 (ko) * 2006-06-21 2013-03-18 삼성전자주식회사 광대역 부호화 및 복호화 방법 및 장치
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
WO2008045846A1 (en) * 2006-10-10 2008-04-17 Qualcomm Incorporated Method and apparatus for encoding and decoding audio signals
CN101483495B (zh) * 2008-03-20 2012-02-15 华为技术有限公司 一种背景噪声生成方法以及噪声处理装置
US8768690B2 (en) * 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
CN101630509B (zh) * 2008-07-14 2012-04-18 华为技术有限公司 一种编解码方法、装置及系统
KR101301245B1 (ko) * 2008-12-22 2013-09-10 한국전자통신연구원 스펙트럼 계수의 서브대역 할당 방법 및 장치
US8930185B2 (en) * 2009-08-28 2015-01-06 International Business Machines Corporation Speech feature extraction apparatus, speech feature extraction method, and speech feature extraction program
US8898057B2 (en) * 2009-10-23 2014-11-25 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus and methods thereof
US8990094B2 (en) * 2010-09-13 2015-03-24 Qualcomm Incorporated Coding and decoding a transient frame
WO2014165032A1 (en) * 2013-03-12 2014-10-09 Aawtend, Inc. Integrated sensor-array processor
US10204638B2 (en) 2013-03-12 2019-02-12 Aaware, Inc. Integrated sensor-array processor
US10049685B2 (en) 2013-03-12 2018-08-14 Aaware, Inc. Integrated sensor-array processor
KR20150032390A (ko) * 2013-09-16 2015-03-26 삼성전자주식회사 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법
EP3637620A1 (en) * 2013-11-07 2020-04-15 Telefonaktiebolaget LM Ericsson (publ) Methods and devices for vector segmentation for coding
US9628266B2 (en) * 2014-02-26 2017-04-18 Raytheon Bbn Technologies Corp. System and method for encoding encrypted data for further processing
JP6724932B2 (ja) * 2018-01-11 2020-07-15 ヤマハ株式会社 音声合成方法、音声合成システムおよびプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05265487A (ja) * 1992-03-18 1993-10-15 Sony Corp 高能率符号化方法
JPH06291674A (ja) * 1991-06-06 1994-10-18 Matsushita Electric Ind Co Ltd 適応変換ベクトル量子化符号化法
WO1995034956A1 (fr) * 1994-06-13 1995-12-21 Sony Corporation Procede et dispositif de codage de signal, procede et dispositif de decodage de signal, support d'enregistrement et dispositif de transmission de signaux
JPH09230897A (ja) * 1996-02-22 1997-09-05 Nippon Telegr & Teleph Corp <Ntt> 音響信号変換符号化方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2225321T3 (es) * 1991-06-11 2005-03-16 Qualcomm Incorporated Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos.
US5884253A (en) 1992-04-09 1999-03-16 Lucent Technologies, Inc. Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter
US5581653A (en) 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
US5517595A (en) 1994-02-08 1996-05-14 At&T Corp. Decomposition in noise and periodic signal waveforms in waveform interpolation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06291674A (ja) * 1991-06-06 1994-10-18 Matsushita Electric Ind Co Ltd 適応変換ベクトル量子化符号化法
JPH05265487A (ja) * 1992-03-18 1993-10-15 Sony Corp 高能率符号化方法
WO1995034956A1 (fr) * 1994-06-13 1995-12-21 Sony Corporation Procede et dispositif de codage de signal, procede et dispositif de decodage de signal, support d'enregistrement et dispositif de transmission de signaux
JPH09230897A (ja) * 1996-02-22 1997-09-05 Nippon Telegr & Teleph Corp <Ntt> 音響信号変換符号化方法

Also Published As

Publication number Publication date
WO2001006493A1 (en) 2001-01-25
CY1106119T1 (el) 2011-06-08
DE60027573D1 (de) 2006-06-01
EP1204969B1 (en) 2006-04-26
KR20020013965A (ko) 2002-02-21
CN1158647C (zh) 2004-07-21
AU6353600A (en) 2001-02-05
BRPI0012542B1 (pt) 2015-07-07
ES2265958T3 (es) 2007-03-01
HK1047817A1 (en) 2003-03-07
CN1375096A (zh) 2002-10-16
EP1204969A1 (en) 2002-05-15
KR100898323B1 (ko) 2009-05-20
ATE324653T1 (de) 2006-05-15
KR20070087222A (ko) 2007-08-27
US6324505B1 (en) 2001-11-27
BR0012542A (pt) 2002-11-26
JP4659314B2 (ja) 2011-03-30
KR100898324B1 (ko) 2009-05-20
DE60027573T2 (de) 2007-04-26

Similar Documents

Publication Publication Date Title
JP4659314B2 (ja) 音声符号器用のスペクトル・マグニチュード量子化
KR100804461B1 (ko) 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치
JP4870313B2 (ja) 可変レート音声符号器におけるフレーム消去補償方法
KR100752797B1 (ko) 음성 코더에서 선 스펙트럼 정보 양자화법을 인터리빙하는 방법 및 장치
EP1204968B1 (en) Method and apparatus for subsampling phase spectrum information
WO2004015689A1 (en) Bandwidth-adaptive quantization
KR100756570B1 (ko) 음성 코더의 프레임 프로토타입들 사이의 선형 위상시프트들을 계산하기 위해 주파수 대역들을 식별하는 방법및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070718

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100525

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100825

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101130

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101227

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4659314

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term