JP3432822B2 - 可変速度ボコーダ - Google Patents

可変速度ボコーダ

Info

Publication number
JP3432822B2
JP3432822B2 JP50090293A JP50090293A JP3432822B2 JP 3432822 B2 JP3432822 B2 JP 3432822B2 JP 50090293 A JP50090293 A JP 50090293A JP 50090293 A JP50090293 A JP 50090293A JP 3432822 B2 JP3432822 B2 JP 3432822B2
Authority
JP
Japan
Prior art keywords
frame
bits
speech
rate
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP50090293A
Other languages
English (en)
Other versions
JPH06511320A (ja
Inventor
ジェイコブス、ポール・イー
ガードナー、ウイリアム・アール
リー、チョン・ユー
ギルハウセン、クライン・エス
ラム、エス・キャサリン
ツァイ、ミン−チャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=24866989&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP3432822(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JPH06511320A publication Critical patent/JPH06511320A/ja
Application granted granted Critical
Publication of JP3432822B2 publication Critical patent/JP3432822B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0057Block codes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/16Time-division multiplex systems in which the time allocation to individual channels within a transmission cycle is variable, e.g. to accommodate varying complexity of signals, to vary number of channels transmitted
    • H04J3/1682Allocation of channels according to the instantaneous demands of the users, e.g. concentrated multiplexers, statistical multiplexers
    • H04J3/1688Allocation of channels according to the instantaneous demands of the users, e.g. concentrated multiplexers, statistical multiplexers the demands of the users being taken into account after redundancy removal, e.g. by predictive coding, by variable sampling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0014Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the source coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0015Systems modifying transmission characteristics according to link quality, e.g. power backoff characterised by the adaptation strategy
    • H04L1/0017Systems modifying transmission characteristics according to link quality, e.g. power backoff characterised by the adaptation strategy where the mode-switching is based on Quality of Service requirement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0041Arrangements at the transmitter end
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0045Arrangements at the receiver end
    • H04L1/0046Code rate detection or code type detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold

Description

【発明の詳細な説明】 I.発明の分野 本発明はスピーチ処理に関する。特に、本発明は圧縮
の量がダイナミックに変化し、一方において再構成され
たスピーチの品質に最小の影響を与えるスピーチを圧縮
する新しい改良された方法およびシステムに関する。さ
らに、圧縮されたスピーチデータはエラーを導入する可
能性があるチャンネル上を伝送されるように意図されて
いるため、本発明の方法およびシステムはまた音声品質
に対するチャンネルエラーの影響を最小にする。
II.従来技術の説明 デジタル技術による音声の伝送は、特に長距離のデジ
タル無線電話の適用で広く普及してきている。したがっ
て、予測される再構成スピーチの品質を維持するチャン
ネル上を伝送されることができる情報の最少量を決定す
ることが重要である。スピーチがサンプルし、デジタル
化するだけで伝送される場合、通常のアナログ電話のス
ピーチ品質を達成するために64キロビット/秒(kbps)
程度のデータ速度が要求される。しかしながら、適切な
コード化、伝送および受信機における再合成によって後
続されるスピーチ解析の使用により、データ速度の著し
い減少が実現可能である。
人間のスピーチ発生のモデルに関連したパラメータを
抽出することによって発声されたスピーチを圧縮する技
術を使用した装置は、典型的にボコーダと呼ばれてい
る。このような装置は、適切なパラメータを抽出するた
めに入来したスピーチを解析するエンコーダおよびそれ
が伝送チャンネル上で受信したパラメータを使用してス
ピーチを再合成するデコーダから構成されている。正確
であるためには、モデルが一定に変化していなければな
らない。したがって、スピーチはパラメータが計算され
る時間のブロック、すなわち解析フレームに分割され
る。その後、パラメータは新しい各フレームに対して更
新される。
種々のクラスのスピーチコーダのうち、コード励起直
線予測コード化(CELP)、ストカスティック(Stochast
ic)コード化またはベクトル励起スピーチコード化が1
つのクラスである。この特定のクラスのコード化アルゴ
リズムの一例はトーマスE.トレメイン氏他による文献
(“A 4.8kbps Code Excited linear Predictive Code
r",Proceedings of the Mobile Satellite Conference,
1988年)に記載されている。
ボコーダの機能は、スピーチに固有の本来の冗長性を
全て除去することによって低いビット速度の信号にデジ
タル化されたスピーチ信号を圧縮することである。スピ
ーチは典型的に主に音声域のフィルタ処理動作による短
い期間の冗長性および音声コードによる音声域の励起の
ための長い期間の冗長性を有している。CELPコーダにお
いて、これらの動作は短期間フォーマットのフィルタお
よび長期間ピッチのフィルタの2つのフィルタによって
モデル化される。これらの冗長性が除去されると、結果
的な残留信号は、エンコードされなければならない白色
ガウス雑音としてモデル化されることができる。この技
術のベースは、人間の音声域のモデルを使用してスピー
チ波形の短期間の予測を実行するLPCフィルタと呼ばれ
るフィルタのパラメータを計算することである。さら
に、スピーチのピッチに関連した長期間の効果は、人間
の音声和音を本質的にモデル化するピッチフィルタのパ
ラメータを計算することによってモデル化される。最後
に、これらのフィルタは励起されなければならず、これ
は波形が上記の2つのフィルタを励起したときに、結果
として元のスピーチに最も近いコードブック中の多数の
ランダム励起波形の1つを決定することによって実行さ
れる。このように伝送パラメータは(1)LPCフィル
タ、(2)ピッチフィルタおよび(3)コードブック励
起の3つの項目に関連している。
ボコーダ技術の使用はさらにチャンネル上を伝送され
る情報量を減少し、一方において再構成されたスピーチ
の品質を維持しようとすることを目的とするが、さらに
減少するために別の技術が使用される必要がある。伝送
される情報量を減少するために前に使用された1つの技
術は音声活動のゲート化である。この技術において、ス
ピーチの休止(pause)中に伝送される情報はない。こ
の技術はデータ減少の所望の結果を達成するが、いくつ
かの欠点がある。
多くの場合において、スピーチの品質はワードの最初
の部分のクリッピングにより低下される。非活動中のチ
ャンネルをオフにゲート制御することに関する別の問題
は、システム利用者が通常スピーチに付随する背景雑音
の欠如を知覚し、通常の電話機の呼びより低くチャンネ
ルの品質を評価することである。活動ゲート制御に関す
る別の問題は、スピーチが生じないときに背景中の時々
の突発的な雑音が送信機をトリガーし、結果的に受信機
における雑音のバーストを除去することである。
音声活動ゲートシステム中で合成されたスピーチの品
質を改良するしようとする試みにおいて、合成された快
適な雑音はデコード化プロセス中に付加される。品質の
ある改良は快適な雑音を付加することによって達成され
るが、それは快適な雑音がエンコーダの実際の背景雑音
をモデル化しないため全体的な品質を実質的に改良しな
い。
伝送される必要がある情報を結果的に減少するように
データ圧縮を実現するさらに好ましい技術は、可変速度
ボコード処理を行うことである。スピーチは沈黙期間す
なわち休止の期間を本質的に含んでいるため、これらの
期間を表すために要求されるデータ量は減少されること
かできる。可変速度ボコーダは、これらの沈黙期間に対
するデータ速度を減少することによってこの事実を非常
に効果的に利用する。沈黙期間に対するデータ伝送中の
完全な停止と対照的に、データ速度の減少は音声活動ゲ
ート制御に関連した問題を克服し、一方において伝送さ
れた情報の減少を促進する。
したがって、本発明の目的は可変速度ボコード化技術
を使用してスピーチを圧縮する新しい改良された方法お
よびシステムを提供することである。
発明の要約 本発明は、前に述べられたスピーチコーダのクラス、
コード励起直線予測コード化(CELP)、ストカスティッ
クコード化またはベクトル励起スピーチコード化のボコ
ーダアルゴリズムを実行する。CELP技術自身は、再合成
時に高品質のスピーチを結果的に生じさせるようにスピ
ーチを表すために必要なデータの量を著しく減少する。
上記のように、ボコーダパラメータは各フレームに対し
て更新される。本発明のボコーダは、モデルパラメータ
の周波数および正確さを変化することによって可変出力
データ速度を提供する。
本発明は、スピーチ活動に基づいて可変出力データ速
度を生成することによって基本的なCELP技術と最も顕著
に異なっている。構造は、パラメータがスピーチの休止
中に少数回または低い正確さで更新されるように定めら
れる。この技術は、伝送される情報の量をかなり大幅に
減少することを可能にする。データ速度を減少するため
に使用される現象は、所定の話し手が会話中に実際に話
している時間の平均パーセンテージである音声活動係数
である。典型的な2方向電話会話に対して、平均データ
速度は2以上の係数だけ減少される。スピーチの休止
中、背景雑音だけがボコーダによってコード化される。
これらの期間において、人間の音声域モデルに関連した
パラメータのいくつかは伝送される必要がない。
上記のように、沈黙中に伝送される情報の量を制限す
る従来の方法は音声活動ゲートと呼ばれ、沈黙の瞬間に
伝送される情報がない技術である。受信側において、期
間は合成された“快適な雑音”で満たされる。対照的
に、可変速度ボコーダは好ましい実施例においてほぼ8k
bps乃至1kbpsの範囲の速度でデータを連続的に伝送す
る。データの連続伝送を行うボコーダは、合成された
“快適な雑音”を不要にし、背景雑音のコード化は再合
成されたスピーチにさらに自然な性質を与える。したが
って、本発明はスピーチと背景との間の滑らかな転移を
可能にすることによって音声活動ゲートのものに対して
再合成スピーチ品質を著しく改良する。
本発明はさらにエラーの発生をマスクする新しい技術
を含む。データは例えば雑音の多い無線リンクであるチ
ャンネル上を伝送されるため、それはデータ中のエラー
を適合しなければならない。生じるエラー数を減少する
ためにチャンネルコード化を使用する従来の技術は、成
功的にエラーを減少することができる。しかしながら、
チャンネルコード化だけでは再構成されたスピーチの高
品質を確保するのに必要なエラー保護のレベルに完全に
達しない。ボコード処理が連続的に発生する可変速度ボ
コーダにおいて、エラーはワードまたは音節の開始等の
重要なスピーチ事象に関連したデータを破壊する。ボコ
ーダに基づいた直線予測コード化(LPC)に関する典型
的な問題は、音声域モデルに関連したパラメータ中のエ
ラーが曖昧に人間の声のようであり、聞き手を困惑させ
るのに十分に元のワードの音を変化させる音を生じさせ
ることである。本発明において、聞き手に対する知覚可
能性を減少するようにエラーがマスクされる。したがっ
て、本発明において実行されるエラーマスキングはスピ
ーチの明瞭さに対するエラーの影響を著しく減少させ
る。
任意のパラメータが変化する可能な最大量は低速で小
さい範囲に制限されているため、これらの速度で伝送さ
れるパラメータ中のエラーはスピーチ品質にほとんど影
響を与えない。異なる速度のエラーはスピーチ品質に対
して異なる知覚的影響を与えるため、伝送システムは高
速データをさらに保護するように最適化されることがで
きる。したがって、本発明は付加的な特徴としてチャン
ネルエラーに対する強さを提供する。
CELPアルゴリズムの可変速度出力変形を行う時の本発
明は、結果的に音声活動に応じて8:1から64:1にダイナ
ミックに変化するスピーチ圧縮を実行させる。述べられ
た圧縮係数はμ法則入力を参照して引用され、圧縮係数
は直線入力に対して2の係数だけ高い。速度決定は、音
声活動係数を完全に利用するようにフレーム単位ベース
で行われる。スピーチ中の休止に対して生成されるデー
タが少なくても、再合成された背景雑音の知覚される劣
化は最小にされる。本発明の技術を使用すると、近い呼
びの品質のスピーチが通常の会話において8kbpsの最大
データ速度および3.5kbps程度の平均データ速度で達成
されることができる。
本発明はスピーチ中の短い休止が検出されることを可
能にするため、実効音声活動係数の減少が実現される。
速度決定はハングオーバーなしにフレーム単位ベースで
実行されることが可能であり、好ましい実施例において
データ速度は典型的に20m秒のフレーム期間と同じ短さ
のスピーチ中の休止に対して低下される。したがって、
音節間にあるような休止が捕捉される。この技術は、語
句の間の長期間の休止だけでなく、短い休止もまた低速
でエンコードされることができるため従来考えられるも
の以上に音声活動係数を減少する。
速度決定はフレームベースで行われるため、音声活動
ゲートシステムのようにワードの開始部分のクリッピン
グは存在しない。この特性のクリッピングは、スピーチ
の検出とデータの伝送の再スタートとの間の遅延のため
に音声活動ゲート化システムにおいて発生する。各フレ
ームに基づいた速度決定の使用は、結果的に全ての転移
が自然の音を有するスピーチを生じさせる。
常に伝送しているボコーダにより、話し手の周囲の背
景雑音は連続的に受信端で聞取られ、それによってスピ
ーチ休止中さらに自然な音を生成する。したがって、本
発明は背景雑音に滑らかな転移を与える。聞き手がスピ
ーチ中の背景雑音において聞取るものは、音声活動ゲー
トシステムのように休止中に合成された快適な雑音に突
然変化しない。
背景雑音は伝送のために連続的にボコード化されるた
め、背景の重要な事象は完全に明瞭に送られることがで
きる。ある場合には、重要な背景雑音は最高の速度でコ
ード化されてもよい。最大速度のコード化は、例えば大
声で話している者が背景にいる場合、または街路にいる
利用者の側を救急車が通過した場合に発生する。しかし
ながら、一定な、または遅く変化する背景雑音は低速で
エンコードされる。
可変速度ボコード化の使用は、デジタルセル電話機シ
ステムに基づいたコード分割多重アクセス(CDMA)の能
力を2以上の係数だけ高めることを約束する。CDMAによ
りチャンネル間の干渉は任意のチャンネル上のデータ伝
送の速度が減少すると自動的に低下するため、CDMAおよ
び可変速度ボコードが特に整合される。対照的に、TDMA
またはFDMAのような伝送スロットが割当てられるシステ
ムを考慮すると、このようなシステムがデータ伝送速度
の低下を利用するために、別の利用者に未使用のスロッ
トの再割当てを調整するために外部的な介入が要求され
る。このような方式に固有の遅延はチャンネルが長いス
ピーチ休止中だけ再度割当てられることを示唆してい
る。したがって、十分な利点が音声活動係数から得られ
ることができない。しかしながら、外部調整により、可
変速度ボコードは示された別の理由からCDMA以外のシス
テムで有効である。
CDMAシステムにおいて、スピーチ品質は余分のシステ
ム容量が所望された時に少し劣化される可能性がある。
概略的に述べると、ボコーダは異なる結果的なスピーチ
品質で異なる速度で全て動作する多数のボコーダと考え
られる。したがって、スピーチ品質はデータ伝送の平均
速度をさらに減少するために混合されることがてきる。
最初の実験は、全速度および半分の速度のボコード処理
されたスピーチを混合することによって例えば最大の許
容可能なデータ速度が8kbpsと4kbpsとの間でフレーム単
位ベースで変化され、結果的にスピーチは最大4kbpsの
半分の速度の変数より良好であるが、最大8kbpsの全速
度変数ほど良くない品質を有することを示している。
大部分の電話機会話において、1人の人間だけが一時
に話すことが良く知られている。完全な二重電話リンク
用の付加的な機能として、速度インターロックが設けら
れてもよい。リンクの1方向が最高の伝送速度で送信し
ている場合、リンクの他の方向の送信は強制的に最低速
度にされる。リンクの2つ方向間のインターロックは、
リンクの各方向の50%以下の平均使用を保証することが
できる。しかしながら、活動ゲート化時の速度インター
ロックの場合のように、チャンネルがゲート制御でオフ
される場合、聞き手が話し手を遮って会話における話し
手の役割を引継ぐ方法はない。本発明は、ボコード速度
を設定する制御信号によって速度インターロックの能力
を容易に提供する。
最後に、可変速度ボコード方式を利用することによっ
て、信号情報はスピーチ品質に対する非常に小さい影響
を与えるだけでスピーチデータとチャンネルを共有する
ことができることに留意しなければならない。例えば、
高速フレームは低速音声データを送る半分および信号伝
送データ用の別の半分との2つの部分に分割される。好
ましい実施例のボコーダにおいて、全速度および半分の
速度のボコードされたスピーチ間のスピーチ品質におけ
る小さい劣化だけが実現される。したがって、別のデー
タと共有された伝送用の低速でのスピーチのボコードは
結果的に利用者に対してほとんど知覚不可能な差を生じ
るだけである。
図面の簡単な説明 本発明の特徴、目的および利点は以下の詳細な説明お
よび対応的に示す図面から明らかになるであろう。図面
において、同じ参照符号は同じ部分を示している。
図1a乃至図1eは、種々の速度に対するボコーダ解析フ
レームおよびサブフレームをグラフで示す。
図2a乃至図2dは、種々の速度に対するボコーダ出力ビ
ット分布を示した一連のチャートである。
図3は、一例のエンコーダの一般化されたブロック図
である。
図4はエンコーダフローチャートである。
図5は一例のデコーダの一般化されたブロック図であ
る。
図6はデコーダのフローチャートである。
図7はエンコーダのさらに詳細な機能的なブロック図
である。
図8はハミングウインドウおよび自己相関サブシステ
ムの一例のブロック図である。
図9は、速度決定サブシステムの一例のブロック図で
ある。
図10は、LPC解析サブシステムの一例のブロック図で
ある。
図11は、LPCからLSP伝送サブシステムの一例のブロッ
ク図である。
図12は、LPC量子化サブシステムの一例のブロック図
である。
図13は、LSP挿入およびLSPからLPC伝送サブシステム
の一例のブロック図である。
図14は、ピッチ探索用の適用コードブックのブロック
図である。
図15はエンコーダデコーダのブロック図である。
図16はピッチ探索サブシステムのブロック図である。
図17はコードブック探索サブシステムのブロック図で
ある。
図18はデータパッキングサブシステムのブロック図で
ある。
図19はデコーダのさらに詳細な機能的ブロック図であ
る。
図20a乃至図20dは、種々の速度に対してデコーダの受
信されたパラメータおよびサブフレームデコードデータ
を示したチャートである。
図21a乃至図21cは、特別な状態に対してデコーダの受
信パラメータおよびサブフレームデコード化データをさ
らに示したチャートである。
図22は、LSP反転量子化サブシステムのブロック図で
ある。
図23は、ポストフィルタ処理および自動利得制御を備
えたデコーダのさらに詳細なブロック図である。
図24は適応輝度フィルタ特性を示すチャートである。
好ましい実施例の詳細な説明 本発明によると、スピーチおよび、または背景雑音の
ような音は、良く知られた技術を使用してサンプルさ
れ、デジタル化される。例えば、アナログ信号はμ法則
/均一コード変換によって後続される標準方式の8ビッ
ト/μ法則フォーマットによってデジタルフォーマット
に変換される。その代わりとして、アナログ信号は均一
なパルスコード変調(PCM)フォーマットでデジタル形
態に直接変換されてもよい。したがって、好ましい実施
例における各サンプルはデータの1つの16ビットワード
によって表される。サンプルは、各フレームが予め定め
られた数のサンプルから成る入力データのフレームに構
成される。ここに示された実施例において、8kHzのサン
プリング速度が考慮される。各フレームは、8kHzのサン
プル速度で160個のサンプルまたは20m秒のスピーチから
成る。別のサンプリング速度およびフレーム寸法が使用
されてもよいことが理解されなければならない。
ボコードの分野はスピーチコード化用の多数の異なる
技術を含み、そのうちの1つはCELPコード化技術であ
る。CELPコード化技術の要約は、上記の文献(“A 4.8k
bps Code Excited Linear Oredictive Coder")に記載
されている。本発明は、一定数のサンプルでLPC解析が
実行され、ピッチおよびコードブック探索が伝送速度に
応じて変化している数のサンプルで実行されるコード化
されたスピーチデータにおける可変速度を提供するよう
にCELPコード化技術の形態を実行する。概念において、
本発明に適用されるCELPコード化は図3および図5を参
照して論じられる。
本発明の好ましい実施例において、スピーチ解析フレ
ームは長さが20m秒であり、抽出されたパラメータは1
秒当たり50回のバーストで伝送されることを意味する。
さらに、データ伝送速度はほぼ8kbpsから4kbps、2kbps
および1kbpsに変化される。全速度(速度1と示す)
で、データ伝送は8.55kbpsの速度であり、パラメータは
11ビットの内部CRC(サイクル冗長検査)を含む171ビッ
トを使用する各フレームに対してエンコードされる。CR
Cビットがない場合、速度は8kbpsである。半分の速度
(速度1/2と示す)において、データ伝送は4kbpsの速度
であり、パラメータは80ビットを使用する各フレームに
対してエンコードされる。1/4速度(速度1/4と示す)に
おいて、データ伝送は2kbpsであり、パラメータは40ビ
ットを使用する各フレームに対してエンコードされる。
1/8速度(速度1/8と示す)において、データ伝送は1kbp
sであり、パラメータは16ビットを使用する各フレーム
に対してエンコードされる。
図1は、スピーチデータ10の一例の解析フレームおよ
びLPC解析で使用されるハミングウインドウ12の関係を
グラフで示す。異なる速度に対するLPC解析フレームお
よびピッチおよびコードブックサブフレームは図2a乃至
図2dにおいてグラフで示されている。全ての速度に対す
るLPC解析フレームは、同じ大きさであることを理解し
なければならない。
図面を参照すると、特に図1aにおいて、LPC解析はハ
ミングウインドウ12を使用してウインドウ化されるフレ
ーム10の160個のスピーチデータサンプルを使用して行
われる。図1aに示されているように、サンプルs(n)
は各フレーム内において0乃至159の番号を付けられ
る。ハミングウインドウ12は、それが60個のサンプルに
よってフレーム10内においてオフセットされるように位
置される。したがって、ハミングウインドウ12は現在の
データフレム10の60番目のサンプル、s(59)でスター
トして連続し、後続するデータフレーム14の59番目のサ
ンプル、s(58)を含む。したがって、現在のフレーム
であるフレーム10に対して生成された加重されたデータ
はまた次のフレームであるフレーム14からのデータに基
づいたデータを含む。
データ伝送速度に応じて、図1b乃至図1eに示されてい
るようなデータフレーム10の異なるサブフレーム上で多
数回ピッチフィルタおよびコードブック励起パラメータ
を計算するために探索が実行される。好ましい実施例に
おいて、以下説明されるようにピッチおよびコードブッ
ク探索が選択された速度に対応した種々の寸法のサブフ
レームにおいて実行されるように、1つの速度だけがフ
レーム10に対して選択されることが理解されなければな
らない。しかしながら、説明のために、フレーム10の好
ましい実施例の種々の許容された速度に対するピッチお
よびコードブックのサブフレーム構造探索は、図1b乃至
図1eに示されている。
全ての速度において、図1aに示されているように1フ
レーム10当り1つのLPC計算が存在する。図1bに示され
ているように、全速度において各ピッチサブフレーム16
に対して2つのコードブックサブフレーム18が存在して
いる。全速度において4つの各ピッチサブフレーム16に
対して1つづつであり、それぞれ40個のサンプル長(5m
秒)の4つのピッチ更新が存在する。さらに、全速度に
おいて8つの各ピッチサブフレーム16に対して1つづつ
であり、それぞれ20個のサンプル長(2.5m秒)の8つの
コードブック更新が存在している。
1/2速度において、図1cに示されているように各ピッ
チサブフレーム20に対して2つのコードブックサブフレ
ーム22が存在する。ピッチは2つの各ピッチフレーム20
のそれぞれに対して1度づつ2度更新され、一方コード
ブックは4つの各コードブックサブフレーム22に対して
1度づつ4度更新される。1/4の速度において、図1dに
示されているように、単一のピッチサブフレーム20に対
して2つのコードブックサブフレーム26が存在する。ピ
ッチはピッチサブフレーム24に対して1度更新され、一
方コードブックは2つの各コードブックサブフレーム26
に対して1度づつ2度更新される。図1eに示されている
ように、1/8の速度においてピッチは決定されず、コー
ドブックはフレーム10に対応したフレーム28において一
度だけ更新される。
さらに、LPC係数は1フレーム当り1度だけ計算され
るが、それらは各サブフレーム上に中心を持つハミング
ウインドウによりLPC解析の結果を近似するように前の
フレームからの結果的なLSP周波数を使用して4度まで
ラインスペクトル対(LSP)表示を使用して直線的に補
間される。例外は、全速度においてLPC係数がコードブ
ックサブフレームに対して補間されないことである。さ
らに、LSP周波数計算に関する詳細を以下説明する。
ピッチおよびコードブック探索を少ない頻度で実行す
ることに加えて、少ないビットはまたLPC係数の伝送に
割当てられる。種々の速度で割当てられたビットの数は
図2a乃至図2dに示されている。図2a乃至図2dはそれぞれ
スピーチの各160のサンプルフレームに割当てられるボ
コーダエンコードされたデータビットを表す。図2a乃至
図2dにおいて、各LPCブロック30a乃至30dの数は、短期
間LPC係数をエンコードするために対応した速度で使用
されるビットの数である。好ましい実施例において、全
速度、1/2速度、1/4速度および1/8速度においてLPC係数
をエンコードするために使用されたビットの数はそれぞ
れ40、20、10および10である。
可変速度コード化を実行するために、LPCは最初にラ
インスペクトル対(LSP)に変換され、結果的なLSP周波
数はDPCMコーダを使用して個々にエンコードされる。LP
Cのオーダは10であるため、10個のLSP周波数および10個
の独立したDPCMコーダが存在する。DPCMコーダに対する
ビット割当ては表Iに示されている。
エンコーダおよびデコーダの両方において、LSP周波
数はピッチおよびコードブック探索における使用の前に
LPCフィルタ係数に変換される。
ピッチ探索に関して、図2aに示されているような全速
度において、ピッチ更新は各1/4のスピーチフレームに
対して1度づつ4度計算される。全速度での各ピッチ更
新に対して、10ビットは新しいピッチパラメータをエン
コードするために使用される。ピッチ更新は図2b乃至図
2dに示されているように別の速度に対して変化する回で
数実行される。速度が減少すると、ピッチ更新の数もま
た減少する。図2bは、スピーチフレームの各半分に対し
て1度づつ2度計算される1/2速度に対するピッチ更新
を示す。同様に、図2cは全ての各スピーチフレームで一
度計算される1/4速度に対するピッチ更新を示す。全速
度に対するように、10ビットは1/2および1/4速度の各ピ
ッチ更新に対して新しいピッチパラメータをエンコード
するために使用される。しかしながら、図2dに示されて
いるように1/8速度に対して、この速度は少数のスピー
チしかないか、或はスピーチが存在せず、ピッチ冗長性
が存在しないときにフレームをエンコードするために使
用されるため、ピッチ更新は計算されない。
各10ビットのピッチ更新に対して、7ビットはピッチ
遅延を表し、3ビットはピッチ利得を表す。ピッチ遅延
は17と143との間であるように限定される。ピッチ利得
は、3ビット値による表示のために0と2の間に直線的
に量子化される。
コードブック探索に関して、図2aに示されたように全
速度において、コードブック更新はスピーチフレームの
各1/8に対して1度づつ8度計算される。全速度におけ
る各コードブック更新に対して、10ビットは新しいコー
ドブックパラメータをエンコードするために使用され
る。コードブック更新は、図2b乃至図2dに示されている
ように他の速度において変化する回数行われる。しかし
ながら、速度が減少すると、コードブック更新の数も減
少する。図2bは、スピーチフレームの各1/4に対して1
度づつ4度計算される1/2速度に対するコードブック更
新を示す。図2cは、スピーチフレームの各1/2に対して
1度づつ2度計算される1/4に対するコードブック更新
を示す。全速度に対するように、10ビットは1/2および1
/4速度の各ピッチ更新に対して新しいコードブックパラ
メータをエンコードするために使用される。最後に、図
2dは全ての各スピーチフレームに対して1度計算される
1/8速度に対するコードブック更新を示す。1/8速度で2
ビットがコードブック利得を表し、他の4ビットがラン
ダムビットである6ビットが伝送されることに留意しな
ければならない。以下、コードブック更新用のビット割
当てに関してさらに詳細に説明する。
データビットを表すコードブック更新のために割当て
られるビットは、ピッチ予測残留物をベクトル量子化す
ることを必要とした。全速度、1/2および1/4速度に対し
て、各コードフック更新は、10ビット全体に対してコー
ドブックインデクスの7ビットプラスコードブック利得
の3ビットからなる。コードブック利得は、対数ドメイ
ンで動作する微分プラスコード変調(DPCM)コーダを使
用してエンコードされる。類似したビット構造が1/8速
度に対して使用されることができるが、別の方式が好ま
しい。1/8速度に対して、コードブック利得は2ビット
によって表され、一方ランダムに発生された4ビットは
コードブックと置換する疑似ランダム数発生器に対する
シードとして受信されたデータと共に使用される。
図3に示されたエンコーダのブロック図を参照する
と、開ループモードでLPC解析が行われる。入力スピー
チサンプルs(n)の各フレームから、係数(α1乃至
α10)は、以下説明されるようにフォルマント合成フィ
ルタ60における使用のためにLPC解析/量子化装置50に
よって計算される。
しかしながら、ピッチ探索の計算は解析合成方法と呼
ばれる閉ループモードで行われる。しかしながら、構成
において新しいハイブリッド閉ループ/開ループ技術が
ピッチ探索を行うために使用される。ピッチ探索におい
て、エンコード処理は入力スピーチと合成スピーチとの
間の2乗平均エラーを最小にするパラメータを選択する
ことによって実行される。簡明化のために、この説明部
分において速度の問題は考慮しない。しかしながら、ピ
ッチおよびコードブック探索における選択された速度の
影響に関する説明を以下さらに詳細に述べる。
図3に示された概念的な実施例において、知覚加重フ
ィルタ52は以下の式を特徴とする: ここで、 はフォルマント予測フィルタであり、μは知覚加重パラ
メータであり、実施例においてμ=0.8である。ピッチ
合成フィルタ58は以下の式によって特徴付けられる: 1/P(z)=1/(1/bz-L) (3) 以下に説明される加重フィルタであるフォルマント合成
フィルタ60は、以下の式を特徴とする: H(z)=[1/A(z)]W(z) =1/A(z/μ) (4) 入力スピーチサンプルs(n)は、加重されたスピー
チサンプルx(n)が加算器62の和入力に供給されるよ
うに知覚加重フィルタ52によって加重される。知覚加重
は、小さい信号パワーしかない周波数でエラーに加重す
るために使用される。これらの低い信号パワー周波数に
おいて、雑音はさらに知覚的に顕著である。合成スピー
チサンプルx′(n)は、サンプルx(n)から減算さ
れる加算器62の差入力にフォルマント合成フィルタ60か
ら出力される。加算器62から出力されたサンプルの差
は、それらが2乗され、その後加算される2乗平均エラ
ー(MSE)素子64に入力される。MSE素子64の計算結果
は、ピッチ遅延L、ピッチ利得b、コードブックインデ
クスIおよびコードブック利得に対する値を生成する最
小化素子66に供給される。
最小化素子66において、P(z)中のピッチ遅延パラ
メータLに対する全ての可能な値は、乗算器56から値c
(n)と共にピッチ合成フィルタ58に入力される。ピッ
チ探索中、コードブックからの影響はない。すなわちc
(n)=0である。入力スピーチと合成スピーチとの間
の加重されたエラーを最小化するLおよびbの値は最小
化素子66によって選択される。ピッチ合成フィルタ58は
値p(n)を生成し、フォルマント合成フィルタ60に出
力する。ピッチフィルタに対するピッチ遅延Lおよびピ
ッチ利得bが見出だされると、コードブック探索は同じ
方法で行われる。
図3は、本発明において行われた解析合成方法を概念
的に表したものであることを理解すべきである。本発明
の実施例において、フィルタは典型的な閉ループフィー
ドバック構造において使用されない。本発明において、
フィードバック接続は探索中に破断され、開ループフォ
ルマント残留物と置換され、以下においてこの詳細を述
べる。
最小化素子66は、コードブックインデクスIおよびコ
ードブック利得Gに対する値を生成する。コードブック
インデクスIにしたがって複数のランダムガウスベクト
ル値から選択されたコードブック54からの出力値は、ピ
ッチ合成フィルタ58において使用された値c(n)のシ
ーケンスを生成するためにコードブック利得Gによって
乗算器56において乗算される。2乗平均エラーを最小化
するコードブックインデクスIおよびコードブック利得
Gは伝送のために選択される。
知覚的加重W(z)は知覚加重フィルタ52によって入
力スピーチに、またフォルマント合成フィルタ60内に含
まれる加重関数によって合成スピーチに供給されること
に留意すべきである。したがって、フォルマント合成フ
ィルタ60は実際に典型的なフォルマント予測フィルタ特
性1/[A(z)]と式1の加重関数を結合し、結果的に
式3の加重されたフォルマント合成関数を生じさせる加
重されたフォルマント合成フィルタである。
その代りに、知覚加重フィルタ52は加算器62とMSE素
子64との間に位置されることが理解されるべきである。
この場合、フォルマント合成フィルタ60は通常のフィル
タ特性1/[A(z)]を有する。
図4は、図3のエンコーダによるスピーチのエンコー
ド化に含まれるステップのフローチャートを示す。説明
のために、速度決定を含むステップが図4のフローチャ
ートに含まれる。デジタル化されたスピーチサンプルは
ブロック80でサンプリング回路から得られ、その後LPC
係数がブロック82でサンプリング回路から計算される。
LPC係数計算の一部分としてハミングウインドウおよび
自己相関技術が使用される。開始速度決定は、好ましい
実施例においてブロック84でフレームエネルギに基づい
た重要なフレームに対して行われる。
小さい数のビットでLPC係数を効率的にコード化する
ために、LPC係数はブロック86でラインスペクトル対(L
SP)周波数に変換され、その後ブロック88に伝送するた
めに量子化される。選択として、付加的な速度決定はブ
ロック90で行われ、ブロック92において最初の速度に対
するLSPの量子化が不十分であると考えられた場合に速
度の増加が行われる。
解析下のスピーチフレームの第1のピッチサブフレー
ムに対して、LSP周波数はブロック94でピッチ探索の実
行に使用するために挿入され、LPC係数に変換される。
ピッチ探索において、コードブック励起はゼロに設定さ
れる。ピッチ探索において、可能な各ピッチ遅延Lに対
する前述のような合成方法による解析であるブロック96
および98において、合成スピーチは元のスピーチと比較
される。整数値であるLの各値に対して、最適なピッチ
利得bが決定される。Lおよびbの組のうち最適なLお
よびb値の組は、合成スピーチと元のスピーチとの間に
最小の知覚加重された2乗平均エラーを提供する。その
ピッチサブフレームに対して決定されたLおよびbの最
適値に対して、値bは対応したL値と共に伝送するため
にブロック100で量子化される。ピッチ探索の別の実施
例において、値bはピッチ探索の一部分として量子化さ
れた値であり、これらの量子化された値はピッチ探索を
行う時に使用される。したがって、この構成において、
ブロック100におけるピッチ探索後に選択されたb値の
量子化は不要である。
解析下のスピーチフレームの第1のコードブックサブ
フレームに対して、ブロック102においてコードブック
探索の実行時に使用するために、LSP周波数が補間さ
れ、LPC係数に変換される。しかしながら、実施例にお
いて全速度でLSP周波数はピッチサブフレームレベルだ
けに補間される。この補間および変換ステップは、ピッ
チデータが計算されないため結果が実質的に意味のない
速度1/8を除いて、各速度に対するピッチおよびコード
ブックサブフレーム寸法の差のためにピッチ探索のもの
に加えてコードブック探索のために実行される。コード
ブック探索において、ブロック104および106で最適ピッ
チ遅延Lおよびピッチ利得bの値は、可能な各コードブ
ックインデクスIに対して合成スピーチが元のスピーチ
と比較されるようにピッチ合成フィルタにおいて使用さ
れる。整数値であるIの各値に対して、最適なコードブ
ック利得Gが決定される。IおよびGの値の組のうち最
適なIおよびG値の組が合成スピーチと元のスピーチと
の間に最小エラーを提供する。そのコードブックサブフ
レームに対して決定されたIおよびGの最適な値に対し
て、値Gは対応したI値と共に伝送するためにブロック
108で量子化される。コードブック探索の別の実施例に
おいて、Gの値はコードブック探索の一部分として量子
化され、これらの量子化された値はコードブック探索の
実行時に使用される。この別の実施例において、ブロッ
ク108におけるコードブック探索後に選択されたG値の
量子化は不要である。
コードブック探索後、エンコーダ内のデコーダはI、
G、Lおよびbの最適値でランされる。エンコーダのデ
コーダのランは、将来のサブフレームにおける使用のた
めにエンコーダフィルタメモリを再構成する。
ブロック110において、解析が終了されたコードブッ
クサブフレームがピッチ探索が行われたピッチサブフレ
ームに対応したコードブックサブフレームの組の最後の
コードブックサブフレームであるか否かを決定するため
に検査が行われる。換言すると、ピッチサブフレームに
対応したコードブックサブフレームがさらに存在してい
るか否かに関する決定が行われる。実施例において、1
ピッチサブフレーム当り2つのコードブックサブフレー
ムだけが存在している。ピッチサブフレームに対応した
別のコードブックサブフレームがあることが決定された
場合、ステップ102乃至ステップ108はそのコードブック
サブフレームに対して反復される。
ピッチサブフレームに対応したコードブックサブフレ
ームがなければ、ブロック112においてその他のピッチ
サブフレームが解析下のスピーチフレーム内に存在して
いるか否かを決定するために検査が行われ、各ピッチサ
ブフレームおよび対応したコードブックサブフレームに
対してステップ94乃至110が反復される。解析下の現在
のスピーチフレームに対する全ての計算が終了されたと
き、スピーチフレームに対するLPC係数を表す値、各ピ
ッチサブフレームに対するピッチ遅延Lおよび利得b、
および各コードブックサブフレームに対するコードブッ
クインデクスIおよび利得Gはブロック114において伝
送のためにパックされる。
図5を参照すると、LPC係数(αi)に対して受信さ
れた値、ピッチ遅延および利得(L&b)およびコード
ブックインデクスおよび利得(I&G)がスピーチを合
成するために使用されるデコーダブロック図が示されて
いる。図5において、図3のように速度情報は説明を簡
単にするために考慮しない。データ速度情報はサイド情
報として送信されることが可能であり、場合によっては
チャンネル復調段で導出されることができる。
デコーダは、受信されたコードブックインデクスを備
えた、すなわち1/8速度のランダムシードを提供するコ
ードブック130から構成されている。コードブック130か
らの出力は乗算器132の1つの入力に供給され、一方乗
算器132の別の入力はコードブック利得Gを受信する。
乗算器132の出力は、ピッチ遅延Lおよび利得bと共に
ピッチ合成フィルタ134に供給される。ピッチ合成フィ
ルタ134からの出力は、LPC係数αiと共にフォルマント
合成フィルタ136に供給される。フォルマント合成フィ
ルタ136からの出力は、再構成されたスピーチがフィル
タ処理されて出力される適応ポストフィルタ138に供給
される。以下説明するように、デコーダの変形はエンコ
ーダ内において行われる。エンコーダのデコーダは適応
ポストフィルタ138を含まないが、知覚加重フィルタを
含んでいる。
図6は、図5のデコーダの動作に対応したフローチャ
ートである。ブロック150で、デコーダにおいてスピー
チは受信されたパラメータから再構成される。特に、ブ
ロック152においてコードブックインデクスの受信され
た値は、コードベクトルまたはコードブック出力値を生
成するコードブックに入力される。乗算器は受信された
コードブック利得Gと共にコードベクトルを受信し、ブ
ロック154でこれらの値を乗算し、結果的な信号がピッ
チ合成フィルタに供給される。コードブック利得Gは、
受信されたDPCMパラメータをデコード化し、逆量子化す
ることによって再構成されることに留意しなければなら
ない。ピッチ合成フィルタは、ブロック156で乗算器出
力をフィルタ処理するように乗算器の出力信号と共に受
信されたピッチ遅延Lおよび利得b値を供給される。
ピッチ合成フィルタによってコードブックベクトルを
フィルタ処理することから結果的に生じた値は、フォル
マント合成フィルタに入力される。ブロック158におい
て、ピッチ合成フィルタ出力信号のフィルタ処理に使用
するためにLPC係数αiもまたフォルマント合成フィル
タに供給される。LPC係数は、量子化されたLSP周波数に
受信されたDPCMパラメータをデコード化し、LSP周波数
を逆量子化し、LPC係数αiにLSP周波数を変換すること
によって補間のためにデコーダで再構成される。ブロッ
ク160において、フォルマント合成フィルタからの出力
は量子化雑音がマスクされる適応ポストフィルタに供給
され、再構成されたスピーチが利得制御される。ブロッ
ク162において、再構成されたスピーチはアナログ形態
への変換のために出力される。
図7aおよび図7bのブロック図を参照すると、本発明の
スピーチエンコード技術がさらに詳細に示されている。
図7aにおいて、デジタル化されたスピーチサンプルの各
フレームは、自己相関サブシステム202における自己相
関係数の計算前に入力スピーチがウインドウ処理される
ハミングウインドウサブシステム200に供給される。
図8においてハミングウインドウサブシステム200お
よび自己相関サブシステム202の1実施例が示されてい
る。ハミングウインドウサブシステム200は検索表250、
典型的には80×16ビットの読取り専用メモリ(ROM)お
よび乗算器252から構成されている。各速度に対してス
ピーチのウインドウは、160サンプル長である各解析フ
レームの139番目と140番目のサンプル間に中心を有す
る。したがって、自己相関係数を計算するウインドウ
は、60サンプルだけ解析フレームからずらされる。
ウインドウ処理は、ハミングウインドウが中心に関し
て対称的であるため、160個のWH(n)値の80個を含むR
OM表を使用して実行される。ハミングウインドウのオフ
セットは、解析フレームの第1のサンプルに関して60個
の位置だけROMのアドレスポインタを歪めることによっ
て行われる。これらの値は、乗算器252によって対応し
た入力スピーチサンプルと1度正確に乗算される。s
(n)を解析ウインドウ中の入力スピーチ信号とする。
ウインドウ処理されたスピーチ信号sw(n)は次のよう
に定められる: 0≦n≦79に対して、 sw(n)=s(n+60)WH(n) (5) 80≦n≦159に対して、 sw(n)=s(n+60)WH(159−n) (6) 検索表250の内容の例示的な16進法の値は表IIに示さ
れている。これらの値は、14の分数ビットを有する2の
補数として表され、表は左から右、上から下の順序で読
取られる。
自己相関サブシステム202はレジスタ254、マルチプレ
クサ256、シフトレジスタ258、乗算器260、加算器262、
循環シフトジスタ264およびバッファ266から構成されて
いる。ウインドウ化されたスピーチサンプルsw(n)は
20m秒ごとに計算され、レジスタ254にラッチされる。サ
ンプルsw(0)において、LPC解析フレームの第1のサ
ンプル、シフトレジスタ258および264は0にリセットさ
れる。各新しいサンプルsw(n)において、マルチプレ
クサ256はサンプルがレジスタ254から入力することを可
能にする新しいサンプル選択信号を受信する。新しいサ
ンプルsw(n)はまたシフトレジスタ258の最後の位置S
R10にあるサンプルSw(n−10)によって乗算される乗
算器260に供給される。結果的な値は循環シフトレジス
タ264の最後の位置CSR11にある値と加算器262において
加算される。
シフトレジスタ258および260が一度クロックされる
と、シフトレジスタ258の第1の位置SR1においてS
w(n)によりSw(n−1)を置換し、位置CSR10におけ
る前の値を置換する。シフトレジスタ258のクロック時
に、新しいサンプル選択信号は、シフトレジスタ260の
現在の位置SR10におけるサンプルSw(n−9)がマルチ
プレクサ256に入力することが許容されるようにマルチ
プレクサ256への入力から除去される。循環シフトレジ
スタ264において、位置CSR11における前の値は第1の位
置CSR1にシフトされる。マルチプレクサから除去された
新しいサンプメ選択信号により、シフトレジスタ258は
循環シフトレジスタ264と同様にシフトレジスタにおい
てデータの循環シフトを行うように設定する。
シフトレジスタ258および264の両者は、11回の乗算/
累算動作が実行されるように全ての各サンプルにおいて
11回クロックされる。160個のサンプルがクロックされ
た後、循環シフトレジスタ264に含まれる自己相関結果
はR(0)−R(10)としてバッファ266中にクロック
される。全てのシフトレジスタはゼロにリセットされ、
プロセスはウインドウ化されたスピーチサンプルの次の
フレームに対して反復する。
図7aを参照すると、自己相関係数がスピーチフレーム
に対して一度計算されると、速度決定サブシステム204
およびLPC解析サブシステム206はフレームデータ速度お
よびLPC係数をそれぞれ計算するためにこのデータを使
用する。これらの動作は互いに独立しているため、それ
らは任意の順序で、または同時に計算される。ここにお
いて説明のために、速度決定を最初に説明する。
速度決定サブシステム204は(1)現在のフレームの
速度を決定し、(2)背景雑音レベルの新しい評価を計
算する2つの機能を有する。現在の解析フレームに対す
る速度は最初に現在のフレームエネルギ、背景雑音レベ
ルの前の評価、前の速度および制御マイクロプロセッサ
からの速度命令に基づいて決定される。新しい背景雑音
レベルは、背景雑音レベルの前の評価および現在のフレ
ームエネルギを使用して評価される。
本発明は、速度決定のために適用しきい値技術を使用
する。背景雑音が変化すると、速度を選択する時に使用
されるしきい値はそのように変化する。実施例におい
て、3つのしきい値は速度選択RTpを予備的に決定する
ために計算される。しきい値は前の背景雑音評価の直角
位相関数であり、以下のように示される: T1(B)=−5.544613(10-6)B2+4.047152B+363.129
3 (7) T2(B)=−1.529733(10-5)B2+8.750045B+1136.21
4 (8) T3(B)=−3.957050(10-5)B2+18.89962B+3346.78
9 (9) ここで、Bは前の背景雑音評価である。
フレームエネルギは、3つのしきい値T1(B)、T2
(B)およびT3(B)に対して比較される。フレームエ
ネルギが3つの全てのしきい値より下である場合、伝送
の最低速度(1kbps)、RTp=4である速度1/8が選択さ
れる。フレームエネルギが2つのしきい値より下である
場合、伝送の第2の速度(2kbps)、RTp=3である速度
1/4が選択される。フレームエネルギがただ1つのしき
い値より下である場合、伝送の第3の速度(4kbps)、R
Tp=2である速度1/2が選択される。フレームエネルギ
が全てのしきい値より上である場合、伝送の最高速度
(8kbps)、RTp=1である速度1が選択される。
予備速度RTpは前のフレームの最終速度RTrに基づいて
修正されてもよい。予備速度RTpが前のフレームの最終
速度マイナス1(RTr−1)より小さい場合、中間速度R
Tmが設定され、ここでRTm=(RTr−1)である。この修
正プロセスは、高エネルギ信号から低エネルギ信号への
転移が発生した場合に速度をゆっくりとして傾斜で低下
させる。しかしながら、開始速度選択が前の速度マイナ
ス1(RTr−1)に等しいか、またはそれより大きい場
合、中間速度RTmは予備速度RTpと同じに、すなわちRTm
=RTpに設定される。この状況において、低エネルギ信
号から高エネルギ信号への転移が発生したとき、速度は
直に増加する。
最後に、中間速度RTmはさらにマイクロプロセッサか
らの速度制限命令によって修正される。速度RTmがマイ
クロプロセッサによって許容された最高速度より大きい
場合、開始速度RTiは最高許容速度に設定される。同様
に、中間速度RTmがマイクロプロセッサによって許容さ
れた最低速度より小さい場合、開始速度RTiは最低許容
値に設定される。
ある場合、マイクロプロセッサによって決定された速
度で全てのスピーチをコード化することが所望される。
速度制限命令は、所望される速度に最大および最小許容
速度を設定することによって所望される速度でフレーム
速度を設定するために使用することができる。速度制限
命令は、速度インターロック並びにかすみおよびバース
ト伝送のような特別な速度制御状況に対して使用され、
これら両者については以下説明される。
図9は速度決定アルゴリズムの1実施例を提供する。
計算をスタートするために、レジスタ270は加算器272に
供給される値1により予め負荷される。循環シフトレジ
スタ274,276および278はそれぞれ直角位相しきい値の式
(7)乃至(9)の第1、第2および第3の係数により
負荷される。例えば、循環シフトレジスタ274の最後、
中間および最初の位置はそれぞれT1,T2およびT3が計算
される式の第1の係数により負荷される。同様に、循環
シフトレジスタ276の最後、中間および最初の位置はそ
れぞれT1,T2およびT3が計算される式の第2の係数によ
り負荷される。最後に、循環シフトレジスタ278の最
後、中間および最初の位置はそれぞれT1,T2およびT3が
計算される式の定数の項により負荷される。各循環シフ
トレジスタ274,276および278において、値は最後の位置
から出力される。
第1のしきい値T1を計算する時、前のフレームの背景
雑音評価Bは乗算器280においてそれ自身の値を乗算す
ることによって平方される。結果的な値B2の値は、循環
シフトレジスタ274の最後の位置から出力された第1の
係数−5.544613(10-6)により乗算される。この結果的
な値は、乗算器284からの背景雑音Bと循環シフトレジ
スタ276の最後の位置から出力された第2の係数4.04715
2の積と加算器286において加算される。その後、加算器
286からの出力値は、循環シフトレジスタ278の最後の位
置から出力された定数項363.1293と加算器288において
加算される。加算器288からの出力はT1の計算された値
である。
加算器288から出力されたT1の計算された値は、実施
例では自己相関サブシステムから供給された直線ドメイ
ン中の値R(0)であるフレームエネルギEfから加算器
290において減算される。
別の実施例において、フレームエネルギEfはそれが実
効的なウインドウ長により正規化された第1の自己相関
係数R(0)の対数によって近似されるdBの対数ドメイ
ンで表される: ここでLAは自己相関ウインドウ長である。音声活動はま
たピッチ予測利得またはフォルマント予測利得Gaを含む
種々の別のパラメータから測定されてもよいことが理解
されなければならない: ここでE(10)は、10番目の反復後の予測残留エネルギで
あり、E(0)はR(0)と同じであるLPC解析に関して以
下説明するように最初のLPC予測残留エネルギである。
加算器290の出力から、結果的な2の補数差の符号ビ
ットの補数は比較器またはリミタ292によって抽出さ
れ、レジスタ270の出力と加算される加算器272に供給さ
れる。したがって、R(0)とT1との間の差が正なら
ば、レジスタ270は1だけインクレメントされる。差が
負ならば、レジスタ270は同じ状態である。
循環レジスタ274、276および278はその後循環され、T
2に対する式である式(8)の係数がその出力に現れ
る。しきい値T2を計算し、フレームエネルギとそれを比
較するプロセスはしきい値T1に対するプロセスに関して
述べられたように反復される。循環レジスタ274、276お
よび278は、T3に対する式である式(9)の係数がその
出力に現れるように循環。しきい値T3に対する計算およ
びフレームエネルギに対する比較は上記のように行われ
る。3つのしきい値計算および比較の終了後、レジスタ
270は開始速度評価RTiを含む。予備速度評価RTpは速度
ランプダウン論理回路294に供給される。前のフレーム
最終速度RTrはまたレジスタ298に蓄積されるLSP周波数
量子化サブシステムから論理回路294に供給される。論
理回路296は値(RTr−1)を計算し、予備速度評価RTp
および値(RTr−1)の大きいほうを出力として供給す
る。値RTmは速度リミタ論理回路296に供給される。
上記のように、マイクロプロセッサはボコーダ、特に
論理回路296に速度制限命令を供給する。デジタル信号
プロセッサ構造において、この命令はエンコード化プロ
セスのLPC解析部分が終了される前に論理回路296におい
て受信される。論理回路296は速度が速度制限を越え
ず、それが制限を越えた場合には値RTmを修正すること
を保証する。値RTmが許容速度の範囲内にある場合、そ
れは開始速度値RTiとして論理回路296から出力される。
開始速度値RTiは、図7aのLSP量子化サブシステム210に
論理回路296から出力される。
上記のような背景雑音評価は、適用速度しきい値を計
算する時に使用される。現在のフレームに対して、前の
フレーム背景雑音評価Bは現在のフレームに対する速度
しきい値を設定する時に使用される。しかしながら、各
フレームに対して背景雑音評価は、次のフレームに対す
る速度しきい値の決定に使用するために更新される。新
しい背景雑音評価B′は、前のフレーム背景雑音評価B
および現在のフレームエネルギEfに基づいて現在のフレ
ームにおいて決定される。
次のフレーム中に使用するための新しい背景雑音評価
Bの決定(前のフレームの背景雑音評価Bのように)に
おいて、2つの値が計算される。第1の値V1は現在のフ
レームエネルギEfだけである。第2の値V2はB+1およ
びKBの大きいほうであり、ここでK=1.00547である。
第2の値が大きくなり過ぎることを阻止するために、そ
れは強制的に大きい定数M=160,000より下にされる。
2つの値V1またはV2の小さいほうが新しい背景雑音評価
B′として選択される。数学的には、 V1=R(0) (12) V2=最小[160000,最大(KB,B+1)] (13) および新しい背景雑音評価B′は: B′=最小(V1,V2) (14) ここで最小(x,y)はxおよびyの最小値であり、最大
(x,y)はxおよびyの最大値である。
図9はさらに背景雑音評価アルゴリズムの実施例を示
す。第1の値V1は、マルチプレクサ300の1つの入力に
直接供給される現在のフレームエネルギEfだけである。
第2の値V2は、最初に計算された値KBおよびB+1か
ら計算される。値KBおよびB+1を計算する時に、レジ
スタ302に蓄積された前のフレーム背景雑音評価Bは、
加算器304および乗算器306に出力される。現在のフレー
ムにおける使用のためにレジスタ302に蓄積された前の
フレーム背景雑音評価Bは、前のフレームにおいて計算
された新しい背景雑音評価B′と同じであることを留意
しなければならない。加算器304はまた項B+1を生成
するように値Bとの加算のために1の入力値を供給され
る。乗算器306はまた項KBを生成するように値Bとの乗
算のためにKの入力値を供給される。項B+1およびKB
はそれぞれ乗算器308および加算器310の別々の両入力に
加算器304および乗算器306から出力される。
加算器310および比較器またはリミタ312は、項B+1
およびKBの大きいほうの選択時に使用される。加算器31
0はKBから項B+1を減算し、比較器またはリミタ312に
結果的な値を供給する。リミタ312は、項B+1およびK
Bの大きいほうとして出力を選択するようにマルチプレ
クサ308に制御信号を供給する。選択された項B+1ま
たはKBは、定数値Mより下の場合に選択された項を、或
いは値Mより上の場合には値Mを供給する飽和タイプの
リミタであるリミタ314にマルチプレクサ308から出力さ
れる。リミタ314からの出力は第2の入力としてマルチ
プレクサ300に、また1入力として加算器316に供給され
る。
加算器316はまた別の入力においてフレームエネルギE
fを受信する。加算器316および比較器またはリミタ318
は、値Efおよびリミタ314から出力された項の小さい方
を選択する時に使用される。加算器316は、リミタ314か
ら出力された値からフレームエネルギ値を減算し、比較
器またはリミタ318に結果的な値を供給する。リミタ318
は、Ef値およびリミタ314からの出力の小さいほうを選
択するためにマルチプレクサ300に制御信号を供給す
る。マルチプレクサ300から出力された選択された値
は、前のフレーム背景雑音評価Bとして次のフレーム中
に使用するために蓄積されるレジスタ302に新しい背景
雑音評価B′として供給される。
再び図7を参照すると、各自己相関係数R(0)乃至
R(10)は自己相関サブシステム202からLPC解析サブシ
ステム206に出力される。LPC係数は、知覚加重フィルタ
52およびフォルマント合成フィルタ60の両者においてLP
C解析サブシステム206中で計算される。
LPC係数は、文献(RabinerおよびSchafer氏による“D
igital Processing of Speech Signals",Prentice−Hal
l,Inc.,1978年)において論じられるようにダービンの
循環を使用する自己相関方法によって得られる。この技
術は、LPC係数を得るための効率的な計算方法である。
アルゴリズムは以下の式で表されることができる: E(0)=R(0),i=l; (15) 10個のLPC係数は、1≦j≦10に対してαj (10)のラベル
を付けられる。
LPC係数をエンコードする前に、フィルタの安定性が
保証されなければならない。フィルタの安定性は、ピー
ク周波数応答の大きさを減少し、一方ピークの帯域幅を
拡大する少量だけ内側にフィルタ極を放射方向にスケー
ルすることによって達成される。この技術は一般に帯域
幅拡大として知られており、さらに文献(Tohkura氏他
による“Spectral Smoothing in PARCOR Speech A
nalysis−Synthesis",ASSP Transactions,1978年12
月)に示されている。この場合、帯域幅拡大は各LPC係
数にスケールすることによって効率的に実行されること
ができる。したがって、表IIIに示されているように、
結果的なLPC係数はそれぞれLPC解析サブシステム206の
最終的な出力LPC係数α乃至α10を生成するように対
応した6つの値によって乗算される。表IIIに与えられ
た値は2の補数表記で15の小数ビットを持つヘキサデシ
マールで与えられる。この形態において、値0×8000は
値−1.0を表し、値0×7333(または29491)は0.899994
=29491/32768を表す。
動作は、二重正確度すなわち32ビット除算、乗算およ
び加算で実行されることが好ましい。二重正確度の正確
さは自己相関関数およびフィルタ係数のダイナミック範
囲を維持するために好ましい。
図10において、上記の式(15)乃至(20)を実行する
LPCサブシステム206の実施例のブロック図が示されてい
る。LPCサブシステム206は、主計算回路330および主計
算回路330のレジスタを更新するために使用される2つ
のバッファ更新回路332および334の3つの回路部分から
構成されている。計算はバッファ340に値R(1)乃至
R(10)を最初に負荷することによって開始される。計
算を開始するために、レジスタ348はマルチプレクサ344
を介して値R(1)により予め負荷される。レジスタは
マルチプレクサ350を介してR(0)により初期化さ
れ、バッファ352(10個のαj (i-1)値を保持する)はマ
ルチプレクサ354を介して全てゼロに初期化され、バッ
ファ356(10個のαj (i)値を保持する)はマルチプレク
サ358を介して全てゼロに初期化され、iは計算サイク
ルのために1に設定される。簡明化のために、iおよび
jに対するカウンタおよびその他の計算サイクル制御装
置は示されていないが、このタイプの論理回路の設計お
よび集積はデジタル論理回路設計で当業者の能力内にお
いて容易に実行される。
αj (i-1)値は、式(14)に示されているような項kjE
(i-1)を計算するためにバッファ356から出力される。各
値R(i-j)は、乗算器360におけるαj (i-1)値との乗算の
ためにバッファ340から出力される。各結果的な値は、
レジスタ346中の値から加算器362において減算される。
各減算の結果は、次の項が減算されるレジスタ346に蓄
積される。式(14)の合計項に示されているように、i
番目のサイクルには(i−1)の乗算および累算が存在
する。このサイクルの終りにおいて、レジスタ346中の
値は値kiを生成するようにレジスタ348からの値E(i-1)
により除算器364で除算される。
その後、値kiは、上記の式(19)のように値E(i)を計
算するためにバッファ更新回路332において使用され、
これはkiの次の計算サイクル中に値E(i-1)として使用さ
れる。現在のサイクル値kiは、値ki 2を得るためにそれ
自身乗算器366において乗算される。その後、値ki 2は加
算器368において1の値から減算される。この加算の結
果値は、乗算器370においてレジスタ348からの値E(i)
乗算される。結果的な値E(i)は、次のサイクルのために
値E(i-1)として蓄積するためにマルチプレクサ350を介
してレジスタ348に入力される。
値kiは、式(15)のように値αi (i)を計算するために
使用される。この場合、値kiはマルチプレクサ358を介
してバッファ356に入力される。値kiはまた式(18)の
ように値αj (i-1)から値αj (i)を計算するためにバッフ
ァ更新回路334において使用される。バッファ352に現在
蓄積されている値は値αj (i)の計算時に使用される。式
(18)に示されているように、i番目のサイクルには
(i−1)の計算がある。i=1の反復において、この
ような計算は不要である。i番目のサイクルに対するj
の各値に対して、αj (i)の値が計算される。αj (i)の各
値の計算時にαi-j (i-1)の各値は加算器374への出力の
ために乗算器374において値kiと乗算される。加算器374
において、値kiαi-j (i-1)は加算器374に入力される値
αj (i-1)から減算される。各乗算および加算の結果は、
αj (i)の値としてマルチプレクサ358を介してバッファ3
56に供給される。
現在のサイクルに対して値αi (i)およびαj (i)が計算
されると、計算されバッファ356に蓄積された値は、マ
ルチプレクサ354を介してバッファ352に出力される。バ
ッファ356に蓄積された値は、バッファ352中の対応した
位置に蓄積される。このようにしてバッファ352は、i
+1番目のサイクルに対して値kiを計算するために更新
される。
前のサイクルの終了時に生成されるデータα
j (i-1)は、次のサイクル用の更新αj (i)を生成するため
に現在のサイクル中に使用されることに注意することが
重要である。この前のサイクルデータは、次のサイクル
のために更新されたデータを完全に生成するために保存
されなければならない。したがって、2つのバッファ35
6および352は、更新されたデータが完全に生成されるま
でこの前のサイクルデータを保存するために使用され
る。
上記の説明は、更新された値の計算の終了時における
バッファ356からバッファ352へのデータの並列伝送に関
して示されている。この構造は、単一バッファ構造にお
いて発生するような完全な使用前に古いデータを損うこ
となく古いデータが新しいデータを計算するプロセス全
体中に保存されることを保証する。示された構造は、同
じ結果を得るために容易に利用できるいくつかの構造の
1つである。例えばバッファ352および356は、第1のバ
ッファに蓄積された値から現在のサイクルに対する値ki
を計算する時に、更新が使用前に次の計算サイクル中第
2のバッファに蓄積されるように多重化されてもよい。
この次の計算サイクルにおいて、値kiは第2のバッファ
に蓄積された値から計算される。第2のバッファ中の値
および値kiは、次の計算サイクルに対する更新を生成す
るために使用され、これらの更新は第1のバッファに蓄
積される。このバッファの交互動作は、更新が生成さ
れ、一方において更新を生成するために必要とされる進
行している値を重ね書きせずに、更新された値を蓄積す
る計算サイクルの進行の反復を可能にする。この技術の
使用が次のサイクルに対する値kiの計算に関連した遅延
を最小にする。したがって、kiの計算における乗算/累
算の更新はαj (i-1)の次の値が計算されるのと同時に実
行されてもよい。
最後の計算サイクル(i=10)の終了時にバッファ35
6に蓄積された10個のLPC係数αj (10)は、対応した最終
のLPC係数αに到達するようにスケールされる。スケ
ール化は、表IIIにおけるヘックス値である検索表342に
蓄積されたスケール値がマルチプレクサ344を通過する
出力に対して選択されるようにマルチプレクサ344,376
および378にスケール選択信号を供給することによって
行われる。検索表342に蓄積された値は連続的にクロッ
クされ、乗算器360に入力される。乗算器360はまたレジ
スタ356から連続的に出力されたαj (10)の値をマルチプ
レクサ376を介して受信する。スケール化された値は、
マルチプレクサ378を介して乗算器360からLPC・LSP変換
サブシステム208に出力として出力される(図7)。
10個の各スケールされたLPC係数を小さい数のビット
で効率的にエンコードするために、係数は文献(Soong
およびJuang氏による“Line Spectrum Pair(LSP)and
Speech Data Compression",ICASSP′84)に示されてい
るようにラインスペクトル対周波数に変換される。LSP
パラメータの計算は表IVと共に式(21)および(22)で
以下に示されている。
LSP周波数は、以下の式の0乃至πの間に存在する10個
の根である: P(ω)=cos5ω+p1cos4ω+…+p4cosω+p5/2; (2
1) Q(ω)=cos5ω+q1cos4ω+…+q4cosω+q5/2;and
(22) ここでpnおよびqn値はn=1,2,3,4に対するものであ
り、表IVにおいてそれぞれ定められている。
表IVにおいて、α1,…,α10の値はLPC解析の結果生
じたスケールされた係数である。式(21)および(22)
の10個の根は、簡明化のために0乃至0.5の間でスケー
ルされる。LSP周波数の特性は、LPCフィルタが安定して
いるならば2つの関数の根は交互することである。すな
わち最低の根ωはP(ω)の最低の根であり、次に低
い根ωはQ(ω)の最低の根である。10個の周波数の
うち、奇数周波数はP(ω)の根であり、偶数周波数は
Q(ω)の根である。
根の探索は以下のようにして行われる。最初に、上記
のようにLPC係数を加算することによって二重正確度で
pおよびq係数が計算される。その後、P(ω)はπ/2
56ラジアンごとに評価され、これらの値は符号変化に対
して評価され、それはサブ領域中の根を識別する。根が
見出された場合、この領域の2つの境界の間の直線的な
補間が根の位置を近似するために実行される。1つのQ
の根は、周波数の整列特性のためにPの根の各対の間に
存在する(第5のQの根は第5のPの根とπとの間に存
在する)ことが保証されている。2進法探索は、Qの根
の位置を決定するためにPの根の各対の間で実行され
る。構造を容易にするために、各Pの根は最も近いπ/2
56値によって近似され、2進法探索がこれらの近似値間
において実行される。根が見出されない場合、根が見出
だされた最後のフレームからのLSP周波数の前の量子化
されていない値が使用される。
図11を参照すると、LSP周波数を生成するために使用
される回路の実施例が示されている。上記の動作は、モ
ード256でカウンタ402によってアドレスされるコサイン
検索表400に二重正確度で蓄積される0乃至πの間の全
体で257個の可能なコサイン値を必要とする。検索表400
に入力されるjの各値に対して、 cosω,cos2ω,cos3ω,cos4ω,cos5ωの出力が供給さ
れ、ここにおいて: ω=jπ/256 (23) ここでjはカウント値である。
検索表400から出力された値cosω,cos2ω,cos3ω,cos
4ωは、各乗算器404,406,408および410に入力され、一
方値cos5ωは合計器412に直接入力される。これらの値
は、マルチプレクサ414,416,418および420を介してそれ
に入力された値p4,p3,p2およびp1のそれぞれと各乗算器
404,406,408および410において乗算される。この乗算の
結果的な値は、また合計器412に入力される。さらに値p
5として、一定の値0.5、すなわち1/2が乗算器424にマル
チプレクサ422を通って供給され、この一定の値もまた
乗算器424に供給される。乗算器424から出力された結果
的な値は別の入力として合計器412に供給される。マル
チプレクサ414乃至422は、P(ω)およびQ(ω)の両
値の計算に対して同じ回路を使用するようにp/q係数選
択信号に応答して値p1乃至p5またはq1乃至q5の間で選択
する。p1乃至p5またはq1乃至q5の値を生成する回路は示
されていないが、p1乃至p5またはq1乃至q5の値を蓄積す
るレジスタと共にLPC係数およびp1乃至p5またはq1乃至q
5の値を加算および減算する一連の加算器を使用して容
易に構成される。
合計器412は、場合に応じて出力P(ω)またはQ
(ω)を提供するために入力値を合計する。以下の説明
を容易にするために、P(ω)の値の場合を考える。Q
(ω)の値は、q1乃至q5の値を使用して同様にして計算
される。P(ω)の現在の値は合計器412から出力さ
れ、レジスタ426に蓄積される。レジスタ426に前に蓄積
されたP(ω)の先行した値は、レジスタ428にシフト
される。P(ω)の現在および前の値の符号ビットは、
直線補間装置434に送られるエネーブル信号の形態でゼ
ロ交差または符号変化を示すために排他的オアゲート43
0において排他的オアされる。P(ω)の現在および前
の値はまたゼロ交差が発生するP(ω)の2つの値の間
の点を補間するためにエネーブル信号に応答する直線補
間装置434にレジスタ426および428から出力される。値
(j−1)からの距離であるこの直線補間部分的値の結
果は、カウンタ256からの値jと共にバッファ436に供給
される。ゲート430はまた値jおよび対応した部分的な
値FVjの蓄積を可能にするバッファ436にエネーブル信号
を供給する。
部分的な値は加算器438においてバッファ436からの出
力として値jから減算されるか、或はその代りとしてバ
ッファ436への入力としてそれから減算される。別の実
施例において、値j−1がバッファ436に入力され、部
分的な値も入力されるように、バッファ436へのjライ
ン入力におけるレジスタが使用されてもよい。部分的な
値は、レジスタ436における蓄積の前またはその出力時
に値(j−1)に加算される。いずれの場合でも、j+
FVjまたは(j−1)+FVjの結合された値は入力定数値
512によって除算される除算器440に出力される。除算動
作は、表記的な2進ワード中の2進法の少数点位置を単
に変化するだけで簡単に実行される。この除算動作は、
0乃至0.5の間のLSP周波数に到達するために必要なスケ
ール処理を実行する。
P(ω)またはQ(ω)の各関数評価には、5つのコ
サイン検索表、4つの二重正確度乗算および4つの加算
が必要とされる。計算された根は典型的に約13ビットま
で正確であり、単一正確度で蓄積される。LSP周波数は
量子化のためにLSP量子化サブシステム210(図7)に供
給される。
LSP周波数が計算されると、それらは伝送のために量
子化されなければならない。10個の各LSP周波数はバイ
アス値を中心にほぼ囲んでいる。LSP周波数は、入力ス
ピーチが平坦なスペクトル特性を有し、短期間予測が実
行されることができないときにバイアス値を近似するこ
とに留意しなければならない。バイアスはエンコーダに
おいて減算され、簡単なDPCM量子化器が使用される。デ
コーダにおいて、バイアスは再び加算される。LPCからL
SPへの変換サブシステムに供給されたような各LSP周波
数ω乃至ω10に対する16進法の負のバイアス値は、表
Vに示されている。表Vに示された値は、部分的な15ビ
ットを持つ2補数である。ヘックス値0×8000(または
−32768)は−1.0を表す。したがって、表Vの第1の値
である値0×fa2f(または−1489)は−0.045441=−14
89/32768を表す。
サブシステムにおいて使用された予測装置は、サブシ
ステム中のバッファに蓄積された前のフレームからの量
子化されたLSP周波数の0.9倍である。この0.9の減少定
数は、チャンネルエラーが最終的になくなるように挿入
される。
使用される量子化器は直線的であるが、速度と共にダ
イナミック範囲およびステップ寸法を変化させる。高速
フレームにおいてもまたより多くのビットが各LSP周波
数に対して伝送される。表VIにおいて、量子化器のビッ
ト割当ておよびダイナミック範囲が各速度で各周波数に
対して示されている。例えば、速度1であるωは4ビ
ット(すなわち16レベルに)を使用して均一に量子化さ
れ、最も高い量子化レベルは0.025であり、最も低いも
のは−0.025である。
速度決定アルゴリズムによって選択された速度に対す
る量子化範囲が十分に大きくなく、或は傾斜オーバーフ
ローが発生した場合、速度は次に高い速度に高められ
る。速度はダイナミック範囲が適合されるか、或は全速
度に達するまで連続的に高められる。図12において、任
意選択速度増加技術の1実施例のブロック図が与えられ
ている。
図12は、速度増加回路を含むLSP量子化サブシステム2
10の一実施例をブロック図で示す。図12において、現在
のフレームのLSP周波数は除算器440(図11)からレジス
タ442に出力され、これにおいて次のフレームにおける
速度増加決定中の出力のために蓄積される。前のフレー
ムのLSP周波数および現在のフレームのLSP周波数は、現
在のフレーム速度増加決定のためにそれぞれレジスタ44
2および除算器440から速度増加論理回路444に出力され
る。速度増加論理回路444はまた速度決定サブシステム2
04から速度制限命令と共に開始速度決定を受取る。速度
増加が必要であるか否かを決定する時、論理回路444
は、現在および前のフレームのLSP周波数間の差の2乗
の和に基づいて現在のフレームのLSP周波数と前のフレ
ームのLSP周波数を比較する。その後、結果的な値はし
きい値と比較され、しきい値が越された場合に、高品質
のSSのエンコード化を保証するために速度の増加が指示
される。しきい値を越えた時、論理回路444はエンコー
ダにおいて使用される最終速度の出力を供給するように
1速度レベルだけ開始速度をインクレメントする。
図12において、各LSP周波数の値ω乃至ω10は対応
したバイアス値と共に一度に1つづつ加算器450に入力
される。バイアス値は入力LSP値から減算され、その結
果的な値が加算器452に出力される。加算器452はまた減
少定数と乗算された前のフレームの対応したLSP値であ
る予測値を入力として受信する。予測値は、加算器452
によって加算器450の出力値から減算される。加算器452
の出力は量子化器454に入力として供給される。
量子化器454は、リミタ456、最小ダイナミック範囲検
索表458、反転ステップ寸法検索表460、加算器462、乗
算器464およびビットマスク466から構成されている。量
子化は、入力値が量子化器454のダイナミック範囲内に
あるか否かを最初に決定することによって量子化器454
において実行される。入力値は、入力が検索表458にっ
て与えられた境界を越えた場合に、ダイナミック範囲の
上限および下限に入力値を制限するリミタ456に供給さ
れる。検索表458は速度入力およびそれに入力されたLSP
周波数インデクスiに応答してリミタ456に対して表VI
にしたがって蓄積された境界を与える。リミタ456から
出力された値は加算器462に入力され、検索表458によっ
て与えられた最小ダイナミック範囲の最小がそれから減
算される。検索表458から出力された値は、最小のダイ
ナミック範囲の値にしたがって速度およびLSP周波数イ
ンデクスiによって決定され、表VIに示されたように値
の符号を無視する。例えば(全速度,ω)に対する検
索表458中の値は0.025である。
加算器462からの出力は、検索表460から選択された値
により乗算器464において乗算される。検索表460は、表
VIに示された値にしたがって各速度における各LSP値に
対するステップ寸法の逆数に対応した値を含む。検索表
460から出力された値は、速度およびLSP周波数インデク
スiによって選択される。各速度およびLSP周波数イン
デクスiに対して、検索表460に蓄積された値は量[(2
n−1)/ダイナミック範囲]であり、ここにおいてn
は量子化された値を表すビットの数である。例えば、
(速度1,ω)に対する検索表460中の値は(15/0.05)
または300である。
乗算器464からの出力は、ビットマスク466に供給され
た0乃至2n−1の間の値である。速度およびLSP周波数
インデクスiに応答するビットマスク466は、表VIにし
たがって適切な数のビットを入力値から抽出する。抽出
されたビットは、ビット制限出力Δωを提供するよう
に入力値のn整数値ビットである。値Δωは、LSP係
数を表すチャンネル上を伝送される量子化された非バイ
アス微分エンコード化LSP周波数である。
値Δωはまた反転量子化器468,加算器470,バッファ
472および乗算器474から構成された予測装置を通してフ
ィードバックされる。反転量子化器468は、ステップ寸
法検索表476,最小ダイナミック範囲検索表478,乗算器48
0および加算器482から構成されている。
値Δωは、検索表476から選択された値と共に乗算
器480に入力される。検索表476は、表VIに示された値に
したがって各速度における各LSP値に対するステップ寸
法に対応した値を含む。検索表476から出力された値
は、速度およびLSP周波数インデクスiによって選択さ
れる。各速度およびLSP周波数インデクスiに対して、
検索表460に蓄積された値は量[ダイナミック範囲/(2
n−1)]であり、ここにおいてnは量子化された値を
表すビットの数である。乗算器480は入力値を乗算し、
加算器482に出力を供給する。
加算器482は、検索表478から別の入力として値を受信
する。検索表478から出力された値は、最小ダイナミッ
ク範囲値にしたがって速度およびLSP周波数インデクス
iによって決定され、表VIに示されたように値の符号を
無視する。加算器482は、検索表478によって与えられた
最小ダイナミック範囲値に乗算器480から出力された値
を加算し、結果な値が加算器470に出力される。
加算器470は、乗算器474から出力された予測値を別の
入力として受信する。これらの値は加算器470において
加算され、10ワード蓄積バッファ472に蓄積される。現
在のフレーム中にバッファ472から出力された前のフレ
ームの各値は、乗算器474において定数0.9により乗算さ
れる。乗算器474から出力されたような予測値は上記の
ように両加算器452および470に供給される。
現在のフレームにおいて、バッファ472に蓄積された
値は前のフレームの再構成されたLPS値マイナスバイア
ス値である。現在のフレームにおいて同様に、加算器47
0から出力された値はまたバイアス値のない現在のフレ
ームの再構成されたLPS値である。現在のフレームにお
いて、バッファ472および加算器470からの出力は、バイ
アスが値に加算される加算器484および486にそれぞれ供
給される。加算器484および486から出力された値はそれ
ぞれ前のフレームの再構成されたLSP周波数値および現
在のフレームの再構成されたLSP周波数値である。LSP平
滑化は式(24)にしたがって低速度で行われる 平滑化されたLSP=a(現在のLSP)+(1−a)(前のLSP) (24) ここにおいて、 a=全速度に対して0 a=1/2速度に対して0.1 a=1/4速度に対して0.5 a=1/8速度に対して0.85 前のフレーム(f−1)の再構成されたLSP周波数
ω′i,f−1の値および現在のフレーム(f)の再構成
されたLSP周波数ω′i,fの値は量子化サブシステム210
からピッチサブフレームLSP補間サブシステム216および
コードブックサブフレームLSP補間サブシステム226に出
力される。量子化されたLSP周波数値Δωは、伝送の
ためにLSP量子化サブシステム210からデータアセンブラ
サブシステム236に出力される。
以下説明するように加重フィルタおよびフォルマント
合成フィルタにおいて使用されたLPC係数は、エンコー
ドされるピッチサブフレームに適している。ピッチサブ
フレームに対して、LPC係数の補間は各ピッチサブフレ
ームに対して1度実行され、表VIIに示されている通り
である: ピッチサブフレームカウンタ224は、ピッチパラメー
タが計算されるピッチサブフレームの追跡を維持するた
めに使用され、カウンタ出力はピッチサブフレームLSP
補間時に使用するためにピッチサブフレームLSP補間サ
ブシステム216に供給される。ピッチサブフレームカウ
ンタ224はまた選択された速度に対するピッチサブフレ
ームの終了を示す出力をデータパッキングサブシステム
236に供給する。
図13は、適切なピッチサブフレームに対してLSP周波
数を補間するピッチサブフレームLSP補間サブシステム2
16の1実施例を示す。図13において、前および現在のLS
P周波数ω′i,f−1およびω′i,fは、それぞれLSP量子
化サブシステムから乗算器500および502に出力され、乗
算器500および502においてメモリ504から与えられた定
数によりそれぞれ乗算される。メモリ504は1組の定数
値を蓄積し、以下説明するようにピッチサブフレームカ
ウンタからのピッチサブフレーム数の入力にしたがっ
て、前および現在のフレームLSP値との乗算のために表V
IIに示されたように定数の出力を供給する。乗算器500
および502の出力は、表VIIの式にしたがってピッチサブ
フレームLSP周波数値を供給するために加算器506におい
て加算される。各ピッチサブフレームに対して、LSP周
波数の補間が行われると、逆LSP・LPC変換がA(z)お
よび知覚加重フィルタの現在の係数を得るために実行さ
れる。したがって、補間されたLSP周波数値は図7のLSP
・LPC変換サブシステム218に供給される。
LSP・LPC変換サブシステム218は、スピーチを再合成
する時に使用するためにLPC係数に補間されたLSP周波数
を再度変換する。上記の参照文献(SoongおよびJuang氏
による“Line Spectrum Pair(LSP)and Speech Data C
ompression")において、変換プロセスにおいて本発明
中で実行されたアルゴリズムが完全に説明され、また導
き出される。計算は、P(z)およびQ(z)は式(2
5)によってLSP周波数に関して表されることができる: ここで、ωはPの多項式(奇数周波数)の根であり、
また ここで、ωはQの多項式(偶数周波数)の根であり、 A(z)=[P(z)+Q(z)]/2 (27) 計算は最初に奇数周波数iの全てに対して値2cos(ω
)を計算することによって実行される。この計算は、
ゼロ(0)に関して第5のオーダーの単一正確度のコサ
インのテイラー級数拡張を使用して行われる。コサイン
表における最も近い点に関するテイラー拡張はより正確
であることが潜在的に可能であるが、0に関する拡張は
十分な正確さを達成し、過剰な量の計算を含まない。
次に、Pの多項式の係数が計算される。多項式の積の
係数は、個々の多項式の係数のシーケンスの畳み込みで
ある。その後、上記の式(25)におけるzの公称的な係
数の6つのシーケンス: [1,−2cos(ω),1]、[1,−2cos(ω),1]、
…、[1,−2cos(ω),1]および[1,1]の畳み込み
が計算される。
Pの多項式が計算されると、Qの多項式に対して同じ
過程が反復され、上記の式(26)におけるzの公称的な
係数の6つのシーケンス: [1,−2cos(ω),1]、[1,−2cos(ω),1]、
…、[1,−2cos(ω10),1]および[1,−1]および適
切な係数が合計され、2により除算される。すなわちLP
C係数を生成するために1ビットだけシフトされる。
図13はさらにLSP・LPC変換サブシステムの一実施例を
詳細に示す。回路部分508は、ωの入力値から−2cos
(ω)の値を計算する。回路部分508は、バッファ50
9;加算器510および515;乗算器511,512,514,516および51
8並びにレジスタ513および516から構成されている。−2
cos(ω)に対して値を計算する時、レジスタ513およ
び516はゼロに初期化される。この回路はsin(ω)を
計算するため、ωは加算器515において最初に入力定
数値π/2から減算される。この値は乗算器511で2乗さ
れ、その後値(π/2−ω2,(π/2−ω4,(π/2
−ωおよび(π/2−ωは、乗算器512およ
びレジスタ513を使用して連続的に計算される。
テイラー級数拡張係数c[1]乃至c[4]は、乗算
器512から出力された値と共に乗算器514に連続的に供給
される。乗算器514から出力された値は加算器515に入力
され、その加算器515において出力: c[1](π/2−ω+c[2](π/2−ω +c[3](π/2−ω+c[4](π/2−ω
を乗算器517に供給するように合計される。レジスタ516
から乗算器517への入力は加算器510からの出力(π/2−
ω)と乗算器517において乗算される。乗算器517から
の出力すなわち値cos(ω)は出力−2cos(ω)を
供給するように乗算器518において定数−2と乗算され
る。値−2cos(ω)は回路部分520に供給される。
回路部分520はpの多項式の係数の計算に使用され
る。回路部分520は、メモリ521、乗算器522および加算
器523から構成されている。メモリ位置P(1)…P(1
1)のアレイは1に設定されるP(1)を除いて0に初
期化される。古いインデクスの−2cos(ω)の値は、
1≦i≦5,1≦j≦2i+1,j<1に対してP(j)=0で
ある[1,−2cos(ω),1]の畳み込みを実行するため
に乗算器524に供給される。回路部分520はQの多項式の
係数を計算する時に複製される(示されていない)。結
果的なP(1)…P(11)およびQ(1)…Q(11)の
最終の新しい値は回路部分524に供給される。
回路部分524は、i=1乃至i=10に対するピッチサ
ブフレームの10個のLPC係数αの計算を完了するため
に設けられている。回路部分524は、バッファ525および
526、加算器528,528及び529、除算器またはビットシフ
タ530から構成されている。最終のP(i)およびQ
(i)値は、バッファ525および526に蓄積される。P
(i)およびP(i+1)の値は加算器527において加
算され、一方対応するQ(i)およびQ(i+1)の値
は1≦i≦10に対して加算器528において減算される。
加算器527および528の各出力P(z)およびQ(z)は
加算器529に入力されてそこで合計される。加算器の出
力は1位置だけビットをシフトすることによって2で除
算される。値[P(z)+Q(z)]/2として出力され
るる。値[P(z)+Q(z)]/2の各ビットシフトさ
れた値は出力LPC係数αである。ピッチサブフレームL
PC係数は、図7のピッチ探索サブシステム220に供給さ
れる。
LSP周波数はまた全速度を除いて選択された速度によ
って決定されるように各コードブックサブフレームに対
して補間される。補間は、ピッチサブフレームLSP補間
と同様に計算される。コードブックサブフレームLSP補
間は、コードブックサブフレームLSP補間サブシステム2
26において計算され、LSP・LPC変換サブシステム228に
供給され、そこにおける変換はLSP・LPC変換サブシステ
ム218の場合と同様に行われる。
図3を参照して示されているように、ピッチ探索はパ
ラメータを使用して入力スピーチと合成スピーチとの間
のエラーを最小にするこれらのパラメータを選択するこ
とによってエンコード処理が行われる合成技術による解
析である。ピッチ探索において、スピーチは、応答が式
(2)で表されるピッチ合成フィルタを使用して合成さ
れる。各20m秒のスピーチフレームは、上記に示された
ようにフレームに対して選択されたデータ速度に依存す
る多数のピッチサブフレームにさらに分割される。1ピ
ッチサブフレーム当り一度ピッチパラメータbとG、す
なわちピッチ利得および遅延がそれぞれ計算される。実
施例において、ピッチ遅延Lは伝送のために17乃至143
を範囲とし、L16はb=0の場合に反転される。
スピーチコーダは、式(1)で示された形態の知覚雑
音加重フィルタを使用する。上記のように、知覚加重フ
ィルタの目的はエラー関連雑音の影響を減少するように
小さいパワーの周波数のエラーを加重することである。
知覚加重フィルタは、前に見出された短期間予測フィル
タから得られる。加重フィルタおよび以下説明されるフ
ォルマント合成フィルタにおいて使用されるLPC係数
は、エンコード処理されているサブフレームに適した補
間値である。
解析合成動作の実行時、スピーチデコーダ/シンセサ
イザの複写がエンコーダにおいて使用される。スピーチ
エンコーダにおいて使用される合成フィルタの形態は式
(3)および(4)によって与えられる。式(3)およ
び(4)は、知覚加重フィルタによって後続されるデコ
ーダスピーチ合成フィルタに対応し、したがって加重さ
れた合成フィルタと呼ぶ。
ピッチ探索は、現在のフレームにおけるコードブック
からのゼロ供給すなわちG=0を仮定して実行される。
各可能なピッチ遅延Lに対して、スピーチは合成され、
元のスピーチと比較される。入力スピーチと合成された
スピーチとの間のエラーは、その2乗平均エラー(MS
E)が計算される前に知覚加重フィルタによって加重さ
れる。その目的は知覚加重スピーチと知覚加重合成スピ
ーチとの間のエラーを最小にする、Lおよびbの全ての
可能な値からLおよびbの値を得ることである。エラー
の最小化は次の式によって表される: ここにおいてLpは、実施例では全速度ピッチサブフレー
ムに対して40であるピッチサブフレーム中のサンプルの
数である。MSEを最小にするピッチ利得bが計算され
る。これらの計算はLの全ての許容値に対して繰返さ
れ、最小MSEを生成するLおよびbはピッチフィルタに
対して選択される。
最適ピッチ遅延の計算は、n=−Lmax乃至n=(Lp
Lmin)−1の間の全ての時間中フォルマント残留サンプ
ル[図3中のp(n)]を含み、ここにおいてLmaxは最
大ピッチ遅延値であり、Lminは最小ピッチ遅延値であ
り、Lpは選択された速度に対するピッチサブフレーム長
であり、ここでn=0がピッチサブフレームのスタート
である。実施例において、Lmax=143およびLmin=17で
ある。図14に示された符号付け方式を使用すると、速度
1/4に対してn=−143乃至n=142であり、速度1/2に対
してn=−143乃至n=62であり、速度1に対してn=
−143乃至n=22である。n<0に対して、フォルマン
ト残留サンプルはピッチフィルタメモリに保持された前
のピッチサブフレームからのピッチフィルタの出力だけ
であり、閉ループフォルマント残留サンプルと呼ばれ
る。n≧0に対して、フォルマント残留サンプルは入力
が現在の解析フレームスピーチサンプルであるA(z)
のフィルタ特性を有するフォルマント解析フィルタの出
力である。n≧0に対して、フォルマント残留サンプル
は開ループフォルマント残留サンプルと呼ばれ、ピッチ
フィルタおよびコードブックがこのサブフレームで完全
な予測を行った場合、正確にp(n)である。関連した
フォルマント残留サンプル値からの最適ピッチ遅延の計
算の説明は、さらに図14乃至図17を参照して行われる。
ピッチ探索は143個の再構成された閉ループフォルマ
ント残留サンプルに対して行われ、すなわちn<0に対
しp(n)およびn≧0に対してp0(n)であるLp−L
min非量子化開ループフォルマント残留サンプルに対し
てピッチ探索が実行される。探索はLが小さく、したが
って使用される残留サンプルの大部分がn>0であるほ
ぼ開ループ探索から、Lが大きく、したがって使用され
る全ての残留サンプルがn<0であるほぼ閉ルータ探索
に漸次的に実効的に変化する。例えば、全速度で図14に
与えられた符号付け方式を使用すると、ピッチサブフレ
ームは40個のスピーチサンプルから構成され、ピッチ探
索はn=−17乃至n=22と番号付けされたフォルマント
残留サンプルの組を使用して始まる。n−17乃至n=−
1のこの方式において、サンプルは閉ループフォルマン
ト残留サンプルであり、一方n=0乃至n=22において
サンプルは開ループフォルマント残留サンプルである。
最適ピッチ遅延を決定する時に使用される次の組のフォ
ルマント残留サンプルは、n=−18乃至n=21と番号付
けされたサンプルである。n=−18乃至n=−1におい
て、サンプルは閉ループフォルマント残留サンプルであ
り、一方n=0乃至n=21においてサンプルは開ループ
フォルマント残留サンプルである。このプロセスは、ピ
ッチ遅延がフォルマント残留サンプルの最後の組n=−
143乃至n=−104に対して計算されるまでサンプル組を
通して連続される。
式(28)に関して上記に示されたように、その目的
は、知覚加重スピーチマイナス加重フォルマントフィル
タのゼロ入力応答(ZIP)であるx(n)と、Lおよび
bの全ての可能な値に対するフィルタ中のメモリを与え
られない、コードブックからのゼロ供給(G=0)を行
われた知覚加重合成スピーチであるx′(n)との間の
エラーを最小にすることである。式(28)はbに関して
次のように書き直すことができる: ここにおいて、 0≦n≦Lp−1に対して、 y(n)=h(n)p(n−L) (30) ここでy(n)はb=1のときピッチ遅延Lを持つ加重
合成スピーチであり、およびh(n)は式(3)による
フィルタ特性を有する加重フォルマント合成フィルタの
インパルス応答である。
この最小化プロセスは、値ELを最大化することに等し
く、ここにおいて: ここで、 および 所定のLに対する最適bは、 bL=Exy/Eyy (34) であることが認められる。
この探索は、Lの全ての許容可能な値に対して繰返さ
れる。最適bは正に限定され、したがって結果的に任意
の負であるExyにより生じるLは探索において無視され
る。最後に、ELを最大化する遅延Lおよびピッチ遅延b
が伝送のために選択される。
上記のように、以下の式(35)乃至(38)において示
された循環的な畳み込みに対して、フィルタA(z)が
フィルタメモリにおいて常に0でスタートすると仮定す
るため、x(n)は実際に入力スピーチと加重フォルマ
ントフィルタのZIRとの間の知覚加重された差である。
しかしながら、フィルタメモリにおいて0でスタートす
るフィルタは実際にはない。合成において、フィルタは
前のサブフレームから残っている状態を有する。実行時
に、最初の状態の効果はスタート時に知覚加重スピーチ
から減算される。このようにして、p(n)に対して最
初に全てのメモリ=0の定常状態のフィルタA(z)の
応答だけが各Lに対して計算される必要があり、循環的
な畳み込みが使用されることができる。x(n)のこの
値はy(n)以外一度だけ計算される必要があり、ピッ
チフィルタの出力に対するフォルマントフィルタのゼロ
状態応答は、各遅延Lに対して計算される必要がある。
各y(n)の計算は、各遅延を計算される必要がない多
数の冗長な乗算を含む。以下説明する循環的な畳み込み
の方法は、要求される計算を最小にするために使用され
る。
循環的な畳み込みに関して値yL(n)は値y(n)に
よって定められる: yL(n)=h(n)p(n−L) 17L143(3
5) または yL(n)=Σh(i)p(n−L−i) 17L14
3 (36) 式(32)および(33)から、 yL(0)=p(−L)h(0) (37) yL(n)=yL-1(n−1)+p(−L)h(n) 1nLp,17L143
(38) が認められることができる。
このようにして、y17(n)に対する最初の循環的な
畳み込みが実行されると、要求される計算数が大幅に減
少される。上記の速度1に対して与えられた例に対し
て、値y17(n)は番号付けされたフォルマント残留サ
ンプルの組n=−17乃至n=22を使用して式(36)によ
って計算される。
図15を参照すると、エンコーダは図5のデコーダの複
製である図7のデコーダサブシステム235を含み、適応
ポストフィルタは存在しない。図15において、ピッチ合
成フィルタ550への入力はコードブック値cI(n)とコ
ードブック利得Gの積である。出力フォルマント残留サ
ンプルp(n)は、再構成されたスピーチサンプルs′
(n)としてフィルタ処理され、出力されるフォルマン
ト合成フィルタ552に入力される。再構成されたスピー
チサンプルs′(n)は、加算器554において対応した
入力スピーチサンプルs(n)から減算される。サンプ
ルs′(n)とs(n)との間の差は、知覚加重フィル
タ556に入力される。ピッチ合成フィルタ550に関して、
フォルマント合成フィルタ552および知覚加重フィルタ5
56の各フィルタは、Mpがピッチ合成フィルタ550中のメ
モリであり、Maがフォルマント合成フィルタ552中のメ
モリであり、Mwが知覚加重フィルタ556中のメモリであ
るフィルタ状態のメモリを含む。
デコーダサブシステムのフォルマント合成フィルタ55
2からのフィルタ状態Maは、図7のピッチ探索サブシス
テム220に供給される。図16において、フィルタ状態Ma
は、フォルマント合成フィルタ552のZIRを計算するフィ
ルタ560のゼロ入力応答(ZIR)を計算するために設けら
れる。計算されたZIR値は、加算器562において入力スピ
ーチサンプルs(n)から減算され、結果が知覚加重フ
ィルタ564によって加重される。知覚加重フィルタ564か
らの出力xp(n)は式(28)乃至(34)において加重さ
れた入力スピーチとして使用され、ここでx(n)=xp
(n)である。
図14および図15を参照すると、図14に示されているよ
うなピッチ合成フィルタ550は、本質的に上記のように
計算された開および閉ループフォルマント残留サンプル
を蓄積するメモリである適応コードブック568に供給す
る。閉ループフォルマント残留サンプルはメモリ部分57
0に蓄積され、一方開ループフォルマント残留サンプル
はメモリ部分572に蓄積される。サンプルは、上記の例
示的な番号付け方式にしたがって蓄積される。閉ループ
フォルマント残留サンプルは各ピッチ遅延L探索に対す
る使用に関して上記のように構成される。開ループフォ
ルマント残留サンプルは、p0(n)値の計算時にデコー
ダサブシステムフォルマント合成フィルタ552のメモリM
aを使用するフォルマント解析フィルタ574を使用して各
ピッチサブフレームに対して入力スピーチサンプルs
(n)から計算される。現在のピッチサブフレームに対
するp0(n)の値は、適応コードブック568のメモリ部
分572を提供するために一連の遅延素子576を通してシフ
トされる。開ループフォルマント残留サンプルは、生成
されて0として番号付けされ、最後の符号が142である
第1の残留サンプルと共に蓄積される。
図16を参照すると、フォルマントフィルタのインパル
ス応答h(n)はフィルタ566において計算され、シフ
トレジスタ580に出力される。フォルマントフィルタの
インパルス応答h(n)に関して式(29)および(30)
並びに(35)乃至(38)で上記に示されたように、これ
らの値はフィルタにおいて各ピッチサブフレームに対し
て計算される。ピッチフィルタサブシステムの計算要求
をさらに減少するために、フォルマントフィルタのイン
パルス応答h(n)は頭部を切られて20個のサンプルに
される。
乗算器582、加算器584およびシフトレジスタ586と共
にシフトレジスタ580は、上記のようにシウトレジスタ5
80からの値h(n)と適応コードブック568からの値c
(m)との間において循環的な畳み込みを行なうように
構成されている。畳み込み動作は、ピッチ利得が1に設
定されると仮定して、ピッチフィルタメモリからの入力
に対するフォルマントフィルタのゼロ状態応答(ZSR)
を見出すために実行される。畳み込み回路の動作におい
て、各mに対してn個のサイクルはLpから1までであ
り、一方m個のサイクルは(Lp−17)−1から−143ま
でである。レジスタ586において、データはn=1のと
き進められず、n=Lpのときにはデータはラッチされな
い。テータは、M≦−17のときに畳み込み回路から出力
として供給される。
畳み込み回路に続いて、相関および比較回路が最適ピ
ッチ遅延Lおよびピッチ利得bを見出すために探索を行
う。2乗平均エラー(MSE)回路とも呼ばれる相関回路
は、フォルマントフィルタのZIRと入力スピーチとの間
の知覚加重差すなわちx(n)によりZSRの自己および
交差相関を計算する。これらの値を使用して、相関回路
はピッチ遅延の各値に対して最適ピッチ利得bの値を計
算する。相関回路はシフトレジスタ588、乗算器590およ
び592、加算器594および596、レジスタ598および600並
びに除算器602から構成されている。相関回路におい
て、計算はn個のサイクルがLpから1までであり、一方
m個のサイクルは(Lp−17)−1から−143までである
ように行われる。
相関回路は、比較を実行し、ピッチ遅延Lおよびピッ
チ利得bの最適値を決定するためにデータを蓄積する比
較回路によって後続される。比較回路は乗算器604、比
較器606、レジスタ608,610および612並びに量子化器614
から構成されている。比較回路は、合成スピーチと入力
スピーチとの間のエラーを最小にするLおよびbに対す
る値を各ピッチサブフレームに対して出力する。bの値
は、量子化器614によって8レベルに量子化され、3ビ
ット値によって表され、付加的なレベルであるb=0レ
ベルはL=16のときに示される。Lおよびbのこれらの
値は、コードブック探索サブシステム230およびデータ
バッファ222に供給される。これらの値は、ピッチ探索
に使用するためにデータパッキングサブシステム238ま
たはデータバッファ222を介してデコーダ234に供給され
る。
ピッチ探索と同様に、コードブック探索は、パラメー
タを使用して入力スピーチと合成されたスピーチとの間
のエラーを最小にするパラメータを選択することによっ
てエンコード処理が実行される合成コード処理システム
による解析である。速度1/8に対して、ピッチ利得はゼ
ロに設定される。
上記のように、各20m秒は上述べられたようにフレー
ムに対して選択されたデータ速度に依存する多数のコー
ドブックサブフレームにサブ分割される。パラメータG
およびI、コードブック利得およびインデクスは1コー
ドブックサブフレーム当り1度それぞれ計算される。こ
れらのパラメータの計算時、LSP周波数はピッチサブフ
レームLSP補間サブシステム216を参照して示されたもの
と同様にしてコードブックサブフレームLSP補間サブシ
ステム226において全速度を除いてサブフレームに対し
て補間される。コードブックサブフレームの補間された
LSP周波数はまた各コードブックサブフレームに対してL
SP・LPC変換サブシステム228によってLPC係数に変換さ
れる。コードブックサブフレームカウンタは232は、コ
ードブックパラメータが計算されるコードブックサブフ
レームの追跡を維持するために使用され、カウンタの出
力はコードブックサブフレームLSP補間において使用す
るためにコードブックサブフレームLSP補間サブシステ
ム226に供給される。コードブックサブフレームカウン
タは232はまた選択された速度に対するコードブックサ
ブフレームの終了を表す出力をピッチサブフレームカウ
ンタ224に供給する。
励起コードブックは、変数でないホワイトガウスラン
ダムシーケンスから構成された2Mのコードベクトルから
成る。これらは、M=7に対してコードブック中の128
個のエントリィがある。コードブックは、各コードベク
トルが1サンプルだけ隣接したコードベクトルと異なる
ように循環的に構成される。すなわちコードベクトル中
のサンプルは、新しいサンプルが一方の端部でシフトさ
れ、他方の端部においてサンプルが落とされるように1
位置だけシフトされる。したがって、循環的なコードブ
ックは、2M+(LC−1)長である直線アレイとして蓄積
されることが可能であり、ここでLCはコードブックサブ
フレーム長である。しかしながら、構成を簡単にし、メ
モリ間隔を保存するために、循環的なコードブックの2M
サンプル長(128個のサンプル)が使用される。
計算を減少するために、コードブック中のガウス値は
中心クリップされる。値は始めに変数1のホワイトガウ
スプロセスから選択される。その後、大きさが1.2より
小さい任意の値がゼロに設定される。これは効果的に約
75%の値をゼロに設定し、インパルスのコードブックを
生成する。このコードブックの中心クリップは、ゼロに
よる乗算が不要であるため4の係数だけコードブック探
索における循環的な畳み込みを実行するために必要され
る乗算数を減少する。以下、現在の動作において使用さ
れるコードブックを表VIIIに示す。
スピーチコーダは、式(3)で示された形態の加重合
成フィルタを含む式(1)で示された形態の知覚雑音加
重フィルタを使用する。各コードブックインデクスIに
対して、スピーチは合成され、元のスピーチと比較され
る。エラーは、そのMSEが計算される前に知覚加重フィ
ルタによって加重される。
上記のように、目的はIおよびGの全ての可能な値に
対するx(n)とx′(n)との間のエラーを最小にす
ることである。エラーの最小化は以下の式によって表さ
れてもよい: ここにおいてLCはコードブックサブフレーム中のサンプ
ルの数である。式(38)はGに関して書き直される: ここにおいてyは、G=1と仮定してI番目のコードベ
クトルを持つフォルマントフィルタのインパルス応答を
回旋することによって得られる。したがって、MSEの最
小化は: を最大化することに等しい。ここで、 および 所定のIに対する最適Gは、以下の式にしたがって見出
される: GI=Exy/Eyy (44) この探索はIの全ての許容可能な値に対して繰返され
る。ピッチ探索と対照的に、最適利得Gは正または負の
いずれであることも可能である。最後に、EIを最大化す
るインデクスIおよびコードブック利得Gが伝送のため
に選択される。
入力スピーチと加重ピッチおよびフォルマントフィル
タのZIRとの間の知覚的に加重された差であるx(n)
は、一度だけ計算される必要があることに留意しなけれ
ばならない。しかしながら、各コードベクトルに対する
ピッチおよびフォルマントフィルタのゼロ状態応答であ
るy(n)は各インデクスIに対して計算される必要が
ある。循環的なコードブックが使用されるため、ピッチ
探索に対して説明された循環的な回旋が要求される計算
を最小にするために使用されることができる。
再び図15を参照すると、エンコーダは、フィルタ状態
が計算される図5のデコーダの複製の図7のデコーダサ
ブシステム235を含み、ここにおいてMpはピッチ合成フ
ィルタ550中のメモリであり、Maはフォルマント合成フ
ィルタ552中のメモリであり、Mwは知覚加重フィルタ556
中のメモリである デコーダサブシステムのピッチおよびフォルマント合
成フィルタ550および552(図15)からの各フィルタ状態
MpおよびMaは、図7のコードブック探索サブシステム23
0に供給される。図17において、フィルタ状態MpおよびM
aは、ピッチおよびフォルマント合成フィルタ550および
552のZIRを計算するゼロインパルス応答(ZIR)フィル
タ620に供給される。ピッチおよびフォルマント合成フ
ィルタの計算されたZIRは加算器622において入力スピー
チサンプルs(n)から減算され、結果が知覚加重フィ
ルタ624によって加重される。知覚加重フィルタ564から
の出力xc(n)は上記のMSE式(39)乃至(44)におい
て加重入力スピーチとして使用され、ここでx(n)=
xc(n)である。
図17において、フォルマントフィルタのインパルス応
答h(n)はフィルタ626において計算され、シフトレ
ジスタ628に出力される。フォルマントフィルタ応答の
インパルス応答h(n)は、各コードブックサブフレー
ムに対して計算される。計算要求をさらに減少するため
に、フォルマントフィルタのインパルス応答h(n)は
頭部を切られて20個のサンプルにされる。
乗算器630、加算器632およびシフトレジスタ634と共
にシフトレジスタ628は、シフトレジスタ628からの値h
(n)と上記のようにコードブックベクトルを含むコー
ドブック636からの値c(m)との間において循環的な
回旋を実行するように構成されている。この回旋動作
は、コードブック利得が1に設定されると仮定して、各
コードベクトルのフォルマントフィルタのゼロ状態応答
(ZSR)を見出すために実行される。回旋回路の動作に
おいて、各mに対してn個のサイクルはLCから1までで
あり、一方m個のサイクルは1から256までである。レ
ジスタ586において、データはn=1のとき進められ
ず、n=LCのときデータはラッチされない。テータは、
m≦1のときに回旋回路から出力として供給される。し
たがって、回旋回路に後続する相関および比較回路をス
タートする前に、回旋回路はm個のサブフレーム寸法時
間を循環することによって循環的な回旋動作を導くため
に初期化されなければならないことに留意すべきであ
る。
相関および比較回路は、コードブックインデクスIお
よびコードブック利得Gの値を生成するように実際のコ
ードブック探索を導く。2乗平均エラー(MSE)回路と
も呼ばれる相関回路は、ピッチおよびフォルマントフィ
ルタのZIRと入力スピーチx′(n)との間の知覚加重
された差によりZSRの自己および交差相関を計算する。
換言すると、相関回路はコードブックインデクスIの各
値に対してコードブック利得Gの値を計算する。相関回
路はシフトレジスタ638、乗算回路640および642、加算
器644および646、レジスタ648および650並びに除算器65
2から構成されている。相関回路において、計算はn個
のサイクルはLCから1までであり、一方m個のサイクル
は1乃至256までであるように行われる。
相関回路は、コードブックインデクスIおよび利得G
の最適値を決定するために比較およびデータの蓄積を実
行する比較回路によって後続される。比較回路は、乗算
器654、比較器656、レジスタ658,660および662並びに量
子化器664から構成されている。比較回路は、合成スピ
ーチと入力スピーチとの間のエラーを最小にするIおよ
びGに対する値を各コードブックサブフレームに供給す
る。コードブック利得Gは、図12を参照して示されたよ
うにバイアスの除去されたLSP周波数量子化およびコー
ド処理と同様にしてDPCMが量子化中に値をコード化する
量子化器614において量子化される。その後、Iおよび
Gに対するこれらの値はデータバッファ222に供給され
る。
コードブック利得Gの量子化およびDPCMエンコード処
理は、以下の式にしたがって計算される: 量子化されたGi=20logGi−0.45(20logGi-1+20logGi-2) (45) ここにおいて、20logGi-1および20logGi-2は直前のフレ
ーム(i−1)および直前のフレームに先行するフレー
ム(i−2)に対して計算された各値である。
速度と共にLSP、I、G、Lおよびbの値は、データ
が伝送のために配列されるデータパッキングサブシステ
ム236に供給される。1つの構成において、速度と共にL
SP、I、G、Lおよびbの値は、データパッキングサブ
システム236を介してデコーダ234に供給される。別の構
成において、これらの値はピッチ探索において使用する
ためにデータバッファ222を介してデコーダ234に供給さ
れる。しかしながら、好ましい実施例において、コード
ブック符号ビットの保護はコードブックインデクスに影
響を与えるデータパッキングサブシステム236内におい
て使用される。したがって、この保護は、IおよびGデ
ータがデータバッファ222から直接供給された場合を考
慮しなければならない。
データパッキングサブシステム236において、データ
は伝送のために種々のフォルマントにしたがってパック
される。図18は、データパッキングサブシステム236の
機能素子の一実施例を示す。データパッキングサブシス
テム236は、疑似ランダム発生器(PN)670、サイクル冗
長検査(CRC)計算素子672、データ保護論理回路674お
よびデータ結合器676から構成されている。PN発生器670
は速度情報を受信し、1/8速度に対してデータ結合器676
に供給される4ビットランダム数を発生する。CRC素子6
72は、速度と共にコードブック利得およびLSP値を受信
し、全速度に対してデータ結合器676に供給される11ビ
ットの内部CRCコードを発生する。
データ結合器676は速度と共にランダム数、CRCコード
を受信し、データバッファ222からのLSP,I,G,Lおよびb
の値(図7b)は伝送チャンネルデータプロセッササブシ
ステム234に出力を供給する。データが最小でデータバ
ッファ222からデコーダ234に直接供給される構造におい
て、PN発生器の4ビット数はPN発生器670からデータ結
合器676を介してデコーダ234に供給される。全速度にお
いて、CRCビットはデータ結合器674からの出力としてフ
レームデータと共に含まれ、一方1/8速度においてコー
ドブックインデクスの値は落とされ、ランダム4ビット
数によって置換される。
実施例において、コードブック利得符号ビットに対し
て保護が与えられることが好ましい。このビットの保護
は、このビット中の単一のビットエラーに対するベクト
ルデコーダの感度を低くすることである。符号ビットが
検出されないエラーのために変化された場合、コードブ
ックインデクスは最適に関連していないベクトルを示
す。保護なしのエラー状況において、最適ベクトルの負
のものが選択され、このベクトルは本質的に使用される
最悪の可能なベクトルである。ここにおいて使用される
保護方式は、利得符号ビット中の単一のビットエラーが
最適ベクトルの負のものをエラー状況において選択させ
ないことを保証する。データ保護論理回路674はコード
ブックインデクスおよび利得を受信し、利得値の符号ビ
ットを試験する。利得値符号ビットが負であると決定さ
れた場合、値89は関連したコードブックインデクスにモ
ード128で加算される。修正された、または修正されな
いコードブックインデクスは、データ保護論理回路674
からデータ結合器676に出力される。
実施例において、全速度で圧縮された音声パケットデ
ータの最も知覚的に感度の高いビットは、内部CRC(サ
イクル冗長検査)等によって保護されることが好まし
い。11個の余分なビットは、保護されたブロック中の任
意の単一のエラーを補正することができるこのエラー検
出および補正機能を実行するために使用される。保護さ
れたブロックは、10個のLSP周波数の最大桁ビットおよ
び8個のコードブック利得値の最大桁ビットから構成さ
れている。補正不可能なエラーがこのブロックにおいて
発生した場合、パケットは廃棄され、以下説明されるよ
うな削除が通知される。そうでなければ、ピッチ利得は
ゼロに設定されるが、しかし残りのパラメータは受信さ
れたときに使用される。実施例において、サイクルコー
ドは(31,21)サイクルコードを生じる発生器多項式を
有するように選択される: g(x)=1+x3+x5+x6+x8+x9+x10 (46) しかしながら、別の発生器多項式が使用されてもよいこ
とを理解しなければならない。全体的なパリティビット
は、それを(32,21)コードにするように添付される。1
8情報ビットだけが存在しているため、コードワード中
の最初の3デジットはゼロに設定され、伝送されない。
この技術は、シンドロームがこれらの位置においてエラ
ーを示した場合、それが補正不可能なエラーがあること
を意味するように付加的な保護を提供する。システム形
態のサイクルコードのエンコード処理は、×10u(x)
モジュロg(x)としてパリティビットの計算を含み、
ここでu(x)はメッセージ多項式である。
デコード処理終了時に、シンドロームは受信されたベ
クトルのg(x)による除算から余りとして計算され
る。シンドロームがエラーを示さない場合、パケットは
全体的なパリティビットの状態にかかわらず受容され
る。シンドロームが単一のエラーを示した場合、エラー
は全体的なパリティビットの状態が検査しない場合に補
正される。シンドロームが1以上のエラーを示した場
合、パケットは廃棄される。このようなエラー保護方式
に関する詳細は、シンドローム計算の詳細に対するLin
およびCostello氏による文献(“Error Control codin
g:Fundamentals and Applications")において認められ
ることができる。
CDMAセル電話機システムにおいて、データは20m秒の
データ伝送フレームでの伝送用のデータパッキングのた
めにデータ結合器674から伝送チャンネルデータプロセ
ッササブシステム238に供給される。ボコーダが全速度
に対して設定される伝送フレームにおいて、192ビット
は9.6kbpsの実効ビット速度に対して伝送される。この
場合の伝送フレームは、混合フレームタイプ(0=音声
のみ,1=音声およびデータ/信号送信)を示すために使
用される1つの混合モードビット、11内部CRCビットと
共に160のボコーダデータビット、12外部またはフレー
ムCRCビットおよび8テールまたはフラッシュビットか
ら構成されている。1/2速度において、80のボコーダデ
ータビットは、4.8kbpsの実効ビット速度に対して8フ
レームCRCビットおよび8テールビットと共に伝送され
る。1/4速度において、40のボコーダデータビットは、
2.4kbpsの実効ビット速度に対して8テールビットと共
に伝送される。最後に、1/8速度に対して16のボコーダ
データビットは、1.2kbpsの実効ビット速度に対して8
テールビットと共に伝送される。
本発明のボコーダが使用されるCDMAシステムにおいて
使用された変調に関する詳細は、本出願人の別出願の米
国特許出願07/543,496号明細書(1990年6月25日出願,
“SYSTEM AND METHOD FOR GENERATING SIGNAL WAVEFORM
S IN A CDMA CELLULAR TELEPHONE SYSTEM")に記載され
ている。このシステムにおいて、全速度以外の速度でデ
ータビットが20m秒のデータ伝送フレーム内に疑似ラン
ダム的に位置されたビットグループを持つグループに組
織化される方式が使用される。別のフレーム速度および
ビット表記は、ここにおいて説明のためにボコーダおよ
びCDMAシステム構造に関して示されたもの以外に容易に
使用されてもよいため、別の構造がボコーダおよびその
他のシステム適用に利用できることが理解されるべきで
ある。
CDMAシステムおよび別のシステムにも適用可能なフレ
ーム単位ベースのプロセッササブシステム238は、信号
送信データまたはその他の非スピーチ情報データ等の別
のデータを伝送するためにボコーダデータの伝送を中断
する可能性がある。この特定のタイプの伝送状況は“ブ
ランクおよびバースト”と呼ばれる。プロセッササブシ
ステム238は、本質的にフレームに対して所望の伝送デ
ータとボコーダデータを置換する。
同じデータ伝送フレーム中にボコーダデータおよび別
の伝送データの両方を伝送することが所望される別の状
況が生じる。この特定のタイプの伝送状況は、“ディム
およびバースト”と呼ばれる。“ディムおよびバース
ト”伝送において、ボコーダは1/2速度のような所望の
速度でボコーダ最終速度を設定する速度制限命令を与え
られる。1/2速度のエンコーダボコーダデータは、デー
タ伝送フレーム用のボコーダデータと共に付加的なデー
タを挿入するプロセッササブシステム238に供給され
る。
全二重電話機リンクに与えられる付加的な機能は速度
インターロックである。1つの方向のリンクが最高伝送
速度で伝送している場合、別の方向のリンクは強制的に
最低速度で伝送させられる。最低速度でも、話し手が中
断されていると実感して話しを止めるのに十分な理解度
が活動的な話し手に対して有効であり、それによって別
の方向のリンクに活動的な話し手の役割を行なわせる。
さらに、活動的な話し手が試みられた中断にかかわらず
話を続ける場合、話し手自身のスピーチが品質を知覚す
る能力を“妨害する”ため、彼は恐らく品質の劣化を知
覚しない。速度制限命令を使用することによって、ボコ
ーダは通常の速度より低い速度でスピーチをボコード処
理するように設定されることができる。
速度制限命令は、CDMAシステム中の付加的な容量が必
要とされたとき、全速度より低いボコーダ最大速度を設
定するために使用されることができることを理解すべき
である。共通の周波数スペクトルが伝送に使用されるCD
MAシステムにおいて、1つの利用者信号はシステム中に
別の利用者信号に対する干渉として現れる。したがっ
て、システム利用者容量はシステム利用者によって生じ
た全体的な干渉によって制限される。通常システム内に
おける利用者の増加のために干渉のレベルが増加する
と、品質の劣化は干渉の増加のために利用者によって経
験される。
各利用者のCDMAシステム中の干渉に対する影響は、利
用者伝送データ速度の関数である。通常の速度より低い
速度でスピーチをエンコード処理するようにボコーダを
設定することによって、エンコード処理されたデータは
対応した減少した伝送データで伝送され、その利用者に
よって発生させられた干渉のレベルを低下させる。した
がって、システム容量は低速度でスピーチをボコード処
理することによって実質的に増加される。システム要求
が増加すると、利用者ボコーダはシステム制御装置また
はセルベースステーションによってエンコード処理速度
を低下するように命令される。本発明のボコーダは、全
速度および1/2速度でエンコード処理されたスピーチ間
の知覚可能な差があっても、非常に小さい品質のもので
ある。したがって、スピーチが1/2速度のような低速度
でボコード処理されるシステム利用者間の通信の品質に
おける影響は、システムにおける利用者数の増加により
生じた干渉のレベルの増加によって生じたものより重要
ではない。
したがって、通常のボコード処理速度より低い速度に
対して個々のボコーダ速度制限を設定する種々の方式が
使用されてもよい。例えば、セル中の全ての利用者は1/
2速度でスピーチをエンコード処理するように命令され
てもよい。このような動作は利用者間の通信の品質に対
してほとんど影響を与えずに実質的にシステム干渉を減
少し、一方付加的な利用者に対して容量を実質的に増加
する。システムにおける全体的な干渉は付加的な利用者
によって劣化のレベルに増加されるまで、利用者間の通
信の品質における影響はない。
上記のように、エンコーダはスピーチサンプルのフレ
ームをエンコード処理する時に解析・合成技術を行なう
ためにデコーダの複製を含む。図7に示されているよう
に、デコーダ234はいるスピーチとの比較のために合成
されたスピーチを再構成するためにデータパッキングサ
ブシステム238またはデータバッファ222のいずれを介し
て値L,b,lおよびIを受信する。デコーダからの出力は
上記のように値MP,MaおよびMwである。エンコーダにお
いて、および伝送チャンネルの別の端部で合成されたス
ピーチを再構成する時に使用されるようなデコーダ234
に関する詳細は、図19乃至図24を参照して説明される。
図19は、本発明のデコーダの一実施例のフロー図であ
る。エンコーダ内および受信機において構成されている
ようなデコーダの共通の構造のために、これらの構造は
一緒に説明する。図19に関する説明は、そこで受信され
たデータがデコーダにおいて予め処理されなければなら
ず。またエンコーダのデコーダにおいて適切なデータ
(速度,I,G,Lおよびb)がデータパッキングサブシステ
ム238またはデータバッファ222から直接受信されるた
め、主に伝送チャンネルの端部におけるデコーダに関連
している。しかしながら、デコーダの基本的な機能はエ
ンコーダおよびデコーダ動作に対して同じである。
図5を参照して説明されたように、各コードブックサ
ブフレームに対してコードブックインデクスIによって
定められたコードブックベクトルは、蓄積されたコード
ブックから検索される。ベクトルはコードブック利得G
によって乗算され、その後フォルマント残留を生成する
ように各ピッチサブフレーム用のピッチフィルタによっ
てフィルタ処理される。このフォルマント残留はフォル
マントフィルタによってフィルタ処理され、その後出力
スピーチ信号を生成するために自動利得制御装置(AG
C)と共に適用フォルマントポストフィルタおよび輝度
ポストフィルタを通過させられる。
コードブックおよびピッチサブフレームの長さは変化
するが、デコード処理は実行を容易にするためにの40個
のサンプルブロックで実行される。受信された圧縮デー
タは、最初にコードブック利得、コードブックインデク
ス、ピッチ利得、ピッチ遅延およびLSP周波数にパック
解除される。LSP周波数は、図22を参照して説明される
ようにそれらの各反転量子化器およびDPCMデコーダを通
して処理されなければならない。同様に、コードブック
利得値はバイアスアスペクトがないことを除いてLSP周
波数と同じ方法で処理されなければならない。また、ピ
ッチ利得値は反転量子化される。その後、これらのパラ
メータは各デコード処理サブフレームに与えられる。各
デコード処理サブフレームにおいて、2組のコードブッ
クパラメータ(G&I)、1組のピッチパラメータ(b
&L)および1組のLPC係数が40個の出力サンプルを生
成するために必要とされる。図20および21は種々の速度
および別のフレーム条件に対する例示的なサブフレーム
デコード処理パラメータを示す。
全速度フレームに対して、8組の受信されたコードブ
ックパラメータおよび4組の受信されたピッチパラメー
タが存在する。LSP周波数は、4組のLSP周波数を生成す
るために4度補間される。受信されたパラメータおよび
対応したサブフレーム情報は図20aに示されている。
1/2速度フレームに対して、各組の4つの受信コード
ブックパラメータは一度反復され、各組の2つの受信ピ
ッチパラメータは一度反復される。LSP周波数は、4組
のLSP周波数を生成するために3度補間される。受信さ
れたパラメータおよび対応したサブフレーム情報は図20
bに示されている。
1/4速度フレームに対して、各組の2つの受信コード
ブックパラメータは4度反復され、ピッチパラメータの
組はまた4度反復される。LSP周波数は2組のLSP周波数
を生成するために一度補間される。受信されたパラメー
タおよび対応したサブフレーム情報は図20cに示されて
いる。
1/8速度フレームに対して、受信コードブックパラメ
ータの組はフレーム全体に対して使用される。ピッチパ
ラメータは1/8速度フレームに対して存在せず、ピッチ
利得は単にゼロに設定される。LSP周波数は1組のLSP周
波数を生成するために一度補間される。受信されたパラ
メータおよび対応したサブフレーム情報は図20dに示さ
れている。
音声パケットは、CDMAセルまたは自動車ステーション
が信号情報を伝送するためにしばしば無効にされる。ボ
コーダが無効フレームを受信したとき、それは前のフレ
ームのパラメータを少し修正して連続する。コードブッ
ク利得はゼロに設定される。前のフレームのピッチ遅延
および利得は、利得が1以下に限定されることを除いて
現在のフレームピッチ遅延および利得として使用され
る。前のフレームのLSP周波数は、補間のないものとし
て使用される。エンコード端およびデコード端は依然と
して同期され、ボコーダは無効フレームから非常に速く
回復できることに留意されたい。受信されたパラメータ
および対応したサブフレーム情報は図21aに示されてい
る。
フレームがチャンネルエラーのために失われた場合、
ボコーダは前のフレームのエネルギの一部分を維持し、
背景雑音に滑らかに転移することによってこのエラーを
マスクすることを試みる。この場合、ピッチ利得はゼロ
に設定される。ランダムコードブックは前のサブフレー
ムのコードブックインデクスプラス89を使用することに
よって選択される。コードブック利得は前のサブフレー
ムのコードブック利得の0.7倍である。数89に関して特
別なことは何もなく、これは疑似ランダムコードブック
ベクトルを選択する単なる便利な方法である。前のフレ
ームのLSP周波数は、それらのバイアス値: ω=0.9(前のω−ωのバイアス値)+ωのバイアス値 (47) に向かって強制的に減衰させられる。LSP周波数バイア
ス値は表5に示されている。受信されたパラメータおよ
び対応したサブフレーム情報は図21bに示されている。
速度は受信機において決定されることができない場
合、パケットは廃棄され、削除が通知される。しかしな
がら、受信機が決定する場合、エラーに関して以下のこ
とが実行されるが、フレームは全速度で伝送された可能
性が強い。上記に説明されたように全速度において、圧
縮された音声パケットデータの最も知覚的に感度の高い
ビットは、内部CRCによって保護される。デコード端に
おいて、シンドロームは受信されたベクトルをg(x)
で除算したり余りとして式(46)から計算される。シン
ドロームが無エラーを示した場合、パケットは全体的な
パリティビットの状態に関係なく受容される。シンドロ
ームが単一エラーを示した場合、エラーは全体的なパリ
ティビットの状態が検査しない場合に補正される。シン
ドロームが1以上のエラーを示した場合、パケットは廃
棄される。補正不可能なエラーがこのブロック中で発生
した場合、パケットは廃棄され、削除が通知される。そ
うでなければ、図21cに示されているように、ピッチ利
得はゼロに設定されるが、しかし残りのパラメータは補
正されて受信されたときに使用される。
この構造において使用されたポストフィルタは最初に
J.H.Chen氏他による文献(“Real−Time Vector APC Sp
eech Coding At 4800 BPS with Adaptive postfilterin
g",Proc.ICASSP,1987年)において説明された。スピー
チフォルマントはスペクトルの谷より知覚的に重要であ
るため、ポストフィルタはコード化されたスピーチの知
覚的品質を改良するためにフォルマントを少し支援す
る。これは、フォルマント合成フィルタの極を原点に向
って半径方向にスケール処理することによって実行され
る。しかしながら、全極ポストフィルタは一般に結果的
にフィルタ処理されたスピーチの消音を生じさせるスペ
クトル傾斜を導入する。この全極ポストフィルタのスペ
クトル傾斜は、極と同じ位相角度を有するが、半径が小
さいゼロを付加し、結果的に形態: H(z)=A(z/ρ)/A(z/ρ) 0<ρ<σ<1 (48) のポストフィルタを生じさせることによって減少され
る。ここにおいて、A(z)はフォルマント予測フィル
タであり、値ρおよびσはポストフィルタスケール処理
係数であり、ここにおいてρは0.5に設定され、σは0.8
に設定される。
適応輝度フィルタは、フォルマントポストフィルタに
よって導入されたスペクトル傾斜をさらに補償するため
に付加される。輝度フィルタは形態: B(z)=(1−κz-1)/(1+κz-1) (49) であり、ここにおいてκ(この1タップフィルタの係
数)の値はA(z)のスペクトル傾斜の変化を近似する
LSP周波数の平均値によって決定される。
ポストフィルタ処理の結果生じる任意の大きい利得変
動を避けるために、AGCループはそれが非ポストフィル
タ処理されたスピーチとほぼ同じエネルギを有するよう
にスピーチ出力をスケール処理するように構成されてい
る。利得制御は、反転フィルタ利得を得るために40個の
フィルタ出力サンプルの2乗の和で40個のフィルタ入力
サンプルの2乗の和を除算することによって実行され
る。その後、この利得係数の平方根は滑らかにされる: 滑らかなβ=0.2現在のβ+0.98前のβ (50) また、フィルタ出力は出力スピーチを生成するようにこ
の滑らかな反転利得と乗算される。
図19において、データと共に伝送された、或いは別の
手段によって導出された速度と共にチャンネルからのデ
ータは、データパック解除サブシステム700に供給され
る。CDMAシステムに対する一実施例において、速度決定
は、それが各異なる速度でデコード処理されたときに受
信されたデータであるエラー速度から導出されることが
できる。データアンパックサブシステム700において、
全速度でCRCの検査がエラーに対して行われ、この検査
の結果がサブフレームデータアンパックサブシステム70
2に供給される。サブシステム700は、有効なデータを持
つ無効フレーム、削除フレームまたはエラーフレーム等
の異常フレーム状態の指示をサブシステム702に与え
る。サブシステム700はフレームに対するパラメータI,
G,Lおよびbと共に速度をサブシステム702に与える。コ
ードブックインデクスIおよび利得Gの供給時に、利得
値の符号ビットはサブシステム702において検査され
る。符号ビットが負である場合、値89はモード128で関
連したコードブックインデクスから減算される。さら
に、サブシステムにおいてコードブック利得は反転量子
化され、DPCMデコード処理され、一方ピッチ利得が反転
量子化される。
サブシステム700はまたLSP反転量子化/補間サブシス
テム704に速度およびLSP周波数を供給する。サブシステ
ム700は、さらに有効なデータを持つブランクフレー
ム、削除フレームまたはエラーフレームの指示をサブシ
ステム704に与える。デコードサブフレームカウンタ706
はサブフレームカウント値iおよびjの指示を両サブシ
ステム702および704に与える。
サブシステム704において、LSP周波数は反転量子化さ
れ、補間される。図22は、サブシステム704の反転量子
化部分の構造を示し、一方補間部分は実質的に図12を参
照して説明されたものと同じである。図22において、サ
ブシステム704の反転量子化部分は、図12の反転量子化
器468と同一に構成され、同様に動作する反転量子化器7
50から構成されている。反転量子化器750の出力は乗算
器754の出力として供給される。加算機752の出力は、蓄
積されて乗算器754における定数0.9との乗算のために出
力されるレジスタ756に供給される。加算機752の出力は
またバイアス値がLSP周波数に加算される加算機758に供
給される。LSP周波数の順序は、LSP周波数を強制的に最
小に分離させる論理回路760によって保証される。一般
に、エラーが伝送時に発生しなければ、分離を強制する
必要性が生じない。LSP周波数は、図13、図20a乃至20d
および図21a乃至21cを参照して説明されたように補間さ
れる。
図19を参照すると、メモリ708は前のフレームLSP,ω
i,f−1を蓄積するサブシステム704に結合され、またバ
イアス値bωを蓄積するために使用されてもよい。こ
れらの前のフレーム値は、全ての速度に対する補間時に
使用される。有効なデータを持つブランク、削除または
エラーフレームの状態に対して、前のフレームLSPω
i,f−1は図21a乃至21cのチャートにしたがって使用さ
れる。サブシステム700からのブランクフレーム指示に
応答して、サブシステム704は現在のフレームにおいて
使用するためにメモリ708に蓄積された前のフレームのL
SP周波数を検索する。削除フレーム指示に応答して、サ
ブシステム704は上記のように現在のフレームのLSP周波
数を計算するようにバイアス値と共にメモリ708からの
前のフレームのLSP周波数を検索する。この計算の実行
時に、蓄積されたバイアス値は加算器において前のフレ
ームのLSP周波数から減算され、結果が乗算器において
0.9の定数により乗算され、この結果が加算器において
蓄積されたバイアス値に加算される。有用なデータ指示
を持つエラーフレームに応答して、LSP周波数はCRCが成
功した場合に全速度に対して行われたように補間され
る。
LSPは、LSP周波数がLPC値に変換されるLSP・LPC変換
サブシステム710に供給される。サブシステム710は、図
13を参照して説明された図7のLSP・LPC変換サブシステ
ム218および228と実質的に同じである。その後、LPC係
数αはフォルマントフィルタ714およびフォルマント
ポストフィルタ716の両方に供給される。LSP周波数はま
たLSP平均サブシステム712中のサブフレームに対して平
均され、適応輝度フィルタ718に値κとして供給され
る。
サブシステム702は、速度および異常フレーム状態指
示と共にサブシステム700からフレームに対するパラメ
ータI,G,Lおよびbを受信する。サブシステム702はまた
サブフレームカウンタ706から各デコードサブフレーム
1乃至4中の各iカウントに対するjカウントを受信す
る。サブシステム702はまた異常フレーム状態で使用す
るためにG,I,Lおよびbに対して前のフレーム値を蓄積
するメモリ720に結合される。1/8速度以外の通常フレー
ム状態下のサブシステム702は、図20a乃至20dにしたが
ってコードブック722にコードブックインデクス値Ij
供給し、乗算器724にコードブック利得値Gjを供給し、
またピッチフィルタ726にピッチ遅延Lおよび利得b値
を供給する。1/8速度に対して、送信されるコードブッ
クインデクスに対する値がないため、1/8速度に対して1
6ビットパラメータ値(図20d)であるパケットシード
は、速度指示と共にコードブック722に供給される。異
常フレーム状態に対して、値は図21a乃至21cにしたがっ
てサブシステム702から供給される。さらに1/8速度に対
して、図23を参照して説明されるようにコードブック72
2に指示が与えられる。
サブシステム700からのブランクフレーム指示に応答
して、サブシステム702は、利得が1以下に制限され、
現在のフレームデコードサブフレームにおいて使用する
ために蓄積されることを除いて、前のフレームピッチ遅
延Lおよび利得bを検索する。さらに、コードブックイ
ンデクスIは供給されず、コードブック利得Gはゼロに
設定される。削除フレーム指示に応答して、サブシステ
ム702はメモリ720からの前のフレームのサブフレームコ
ードブックインデクスを検索し、加算器において89の値
を加算する。前のフレームのサブフレームコードブック
利得は、Gの各サブフレーム値を生成するように乗算器
において0.7の定数により乗算される。ピッチ遅延値は
供給されず、一方ピッチ利得はゼロに設定される。有用
データ指示を持つエラーフレームに応答して、コードブ
ックインデクスおよび利得は、CRCが成功した場合に全
速度フレームにおける場合のように使用され、一方ピッ
チ遅延値は供給され、ピッチ利得はゼロに設定される。
解析・合成技術におけるエンコーダ・デコーダを参照
して説明されたように、コードブックインデクスIは乗
算器724への出力のためにコードブック値に対する開始
アドレスとして使用される。コードブック利得値はコー
ドブック722からの出力値と乗算器724において乗算さ
れ、その結果はピッチフィルタ726に供給される。ピッ
チフィルタ726は、フォルマントフィルタ714に出力され
るフォルマント残留を生成するために入力ピッチ遅延L
および利得b値を使用する。フォルマントフィルタ714
において、LPC係数はスピーチを再構成するようにフォ
ルマント残留をフィルタ処理する時に使用される。受信
機デコーダにおいて、再構成スピーチはさらにフォルマ
ントポストフィルタ716および適応輝度フィルタ718によ
ってフィルタ処理される。AGCループ728はフォルマント
フィルタ714およびフォルマントポストフィルタ716の出
力において使用され、その出力は適応輝度フィルタ718
の出力と乗算器730において乗算される。乗算器730の出
力は、既知の技術を使用してアナログ形態に変換され、
聞き手に提供される再構成されたスピーチである。エン
コーダのデコーダにおいて、そのメモリを更新するため
に出力に知覚加重フィルタが配置されている。
図22を参照すると、デコーダ自身の構造の詳細が示さ
れている。図22において、コードブック722は、図17を
参照して説明されたものと同じメモリ750から構成され
ている。しかしながら、説明のためにメモリ750に対し
て少し異なる方法が示され、図22にはそのアドレス処理
が示されている。コードブック722はさらにスイッチ75
2,マルチプレクサ753および疑似ランダム数(PN)発生
器754から構成されている。スイッチ752は、図17を参照
して説明されたようにメモリ750のインデクスアドレス
位置を示すコードブックインデクスに応答する。メモリ
750は、出力のためにメモリを通してシフトされた値で
開始メモリ位置を示すスイッチ752を備えた回路メモリ
である。コードブック値は、マルチプレクサ753への1
入力としてメモリ750からスイッチ752を通って出力され
る。マルチプレクサ753は、コードブック利得増幅器、
乗算器724にスイッチ752を通って供給された値の出力を
供給するために全、1/2および1/4の速度に応答する。マ
ルチプレクサ753はまたコードブック722の乗算器724へ
の出力に対してPN発生器754の出力を選択するために1/8
速度指示に応答する。
CELPコード処理の高い音声品質を維持するために、エ
ンコーダおよびデコーダはそれらの内部フィルタメモリ
に蓄積された同じ値を有していなければならない。これ
は、デコーダおよびエンコーダのフィルタが同じシーケ
ンスの値によって励起されるようにコードブックインデ
クスを伝送することによって行われる。しかしながら、
高いスピーチ品質に対して、これらのシーケンスはそれ
らの中に分布されたいくつかのスパイクを持つほぼゼロ
から構成される。このタイプの励起は、背景雑音をコー
ド処理するのに最適ではない。
最低のデータ速度で実行される背景雑音のコード処理
時に、疑似ランダムシーケンスはフィルタを励起するよ
うに構成されてもよい。フィルタメモリがエンコーダお
よびデコーダにおいて同じであることを保証するため
に、2つの疑似ランダムシーケンスは同じでなければな
らない。シードは受信機デコーダに何とか伝送されなけ
ればならない。シードを送信するために使用されること
ができる付加的なビットは存在しないため、伝送された
パケットビットは、数を形成するかのようにシードとし
て使用されることができる。この技術は、低速度でコー
ドブック利得およびインデクスを決定するために全く同
じCELP解析・合成構造が使用されるため実行されること
ができる。相違は、コードブックインデクスが廃棄さ
れ、その代わりにエンコーダフィルタメモリが疑似ラン
ダムシーケンスを使用して更新されることである。した
がって、励起用のシードは解析が行われた後、決定され
ることができる。パケット自身が1組のビットパターン
の間で周期的にサイクル化しないことを保証するため
に、4ランダムビットはコードブックインデクス値の代
わりに1/8速度のパケットに挿入される。したがって、
パケットシードは図2dに示されたように16ビット値であ
る。
PN発生器754は、良く知られた技術を使用して構成さ
れ、種々のアルゴリズムによって実行されてもよい。実
施例において、使用されたアルゴリズムは、Paul Menne
n氏による文献(“DPS chip can produce random numbe
rs using proven algorithm",EDN,1991年1月21日)に
おいて説明された性質のものである。伝送されたビット
パケットは、シーケンスを生成するためにシード(図18
のサブシステム700から)として使用される。1構造に
おいて、シードは値521により乗算され、それに値259を
加算される。この結果的な値から、最小桁ビットが符号
を付けられた16ビット数として使用される。その後、こ
の値は次のコードブック値を生成する時にシードとして
使用される。PN発生器によって生成されたシーケンス
は、1の変数を有するように定常化される。
コードブック722から出力された各値は、デコードサ
ブフレーム中に供給されるとコードブック利得Gにより
乗算器724において乗算される。この値はピッチフィル
タ726の加算器756への1入力として供給される。ピッチ
フィルタ726はさらに乗算器758およびメモリ760から構
成されている。ピッチ遅延Lは、乗算器758に出力され
るメモリ760の分岐の位置を決定する。メモリ760の出力
はピッチ利得値bと乗算器758において乗算され、その
結果が加算器756に出力される。加算器756の出力は、シ
フトレジスタのような一連の遅延素子であるメモリ760
の入力に供給される。値はメモリ760を通してシフトさ
れ(矢印によって示されているような方向に)、選択さ
れた分岐出力においてLの値によって決定されたように
供給される。値はメモリ760を通してシフトされるた
め、143シフトより古い値は廃棄される。加算器756の出
力はまたフォルマントフィルタ714に入力として供給さ
れる。
加算器756の出力はフォルマントフィルタ714の加算器
762の1入力に供給される。フォルマントフィルタ714は
さらに乗算器764a乃至764jおよびメモリ766のバンクか
ら構成されている。加算器762の出力は、シフトレジス
タのような一連の分岐された遅延素子として構成された
メモリ766への入力として供給される。値はメモリ766を
通してシフトされ(矢印によって示されているような方
向に)、端部において廃棄される。各素子は、乗算器76
4a乃至764jの対応したものへの出力としてそこに蓄積さ
れた値を供給する分岐を有する。乗算器764a乃至764jは
またそれぞれメモリ766からの出力との乗算のために各L
PC係数α乃至α10を受取る。加算器762からの出力
は、フォルマントフィルタ714の出力として供給され
る。
フォルマントフィルタ714の出力は、フォルマントポ
ストフィルタ716およびAGCサブシステム728への入力と
して供給される。フォルマントポストフィルタ716は、
メモリ772並びに乗算器774a乃至774j;776a乃至776jおよ
び782a乃至782jと共に加算器768および770から構成され
ている。値がメモリ772を通してシフトされると、それ
らは加算器768および770における和に対してスケール処
理されたLPC計数値との乗算のために対応した分岐にお
いて出力される。フォルマントポストフィルタ716から
の出力は、適応輝度フィルタ718への入力として供給さ
れる。
適応輝度フィルタ718は、加算器加算器784および78
6、レジスタ788および790並びに乗算器792および794か
ら構成されている。図24は、適応輝度フィルタの特性を
示したチャートである。フォルマントポストフィルタ71
6の出力は加算器784に1入力として供給され、一方別の
入力は乗算器792の出力から供給される。加算器784の出
力はレジスタ788に供給され、1サイクルの間蓄積さ
れ、次のサイクル中に図19のLSP平均サブシステム712か
ら供給された値−κと共に乗算器792および794に出力さ
れる。乗算器792および794からの両出力は、加算器784
および786に供給される。加算器786からの出力はAGCサ
ブシステム728およびシフトレジスタ790に供給される。
シフトレジスタ790は、フォルマントフィルタ714からAG
Cサブシステム728へおよびフォルマントポストフィルタ
716を介して適応輝度フィルタ718に供給されたデータ出
力の調整を保証するために遅延ラインとして使用され
る。
AGCサブシステム728は、フォルマントポストフィルタ
716および適応輝度フィルタ718へのスピーチ入力エネル
ギに関してスピーチ出力エネルギをスケール処理するよ
うにフォルマントポストフィルタ716および適応輝度フ
ィルタ718からデータを受信する。AGCサブシステム728
は乗算器798,800,802および804;加算器806,808および81
0;レジスタ812,814および816;除算器818並びに平方根素
子820から構成されている。フォルマントポストフィル
タ716から出力された40サンプルは、値“x"を生成する
ように乗算器798において2乗され、加算器806およびレ
ジスタ812から構成された累算器において合計される。
同様に、レジスタ790の前に行われる、適応輝度フィル
タ718から出力された40サンプルは値“y"を生成するよ
うに乗算器800において2乗され、加算器808およびレジ
スタ814から構成された累算器において合計される。値
“y"は、除算器816において値“x"によって除算され、
結果的にフィルタの反転利得を生じさせる。反転利得係
数の平方根は素子818において取られ、その結果が平滑
にされる。平滑動作は、乗算器802において定数値0.02
により現在の値利得を乗算することによって行なわれ、
この結果はレジスタ820および乗算器804を使用して計算
されたときに前の利得の0.98倍の結果に加算器810で加
算される。その後、フィルタ718の出力は出力再構成ス
ピーチを提供するように乗算器730において平滑にされ
た反転利得と乗算される。出力スピーチは、利用者に出
力するために種々の良く知られた変換技術を使用してア
ナログ形態に変換される。
ここに示された本発明の実施例は単なる一例に過ぎ
ず、機能的に等価である実施例の変更が行なわれてもよ
いことを理解すべきである。本発明は、スピーチサンプ
ルをエンコードし、エンコードされたスピーチをデコー
ドするためにここに示されているような機能動作を提供
するように適切なプログラム制御下においてデジタル信
号プロセッサで実行されてもよい。別の態様において、
本発明は良く知られた非常に大きいスケールインテグレ
ーション(VLSI)技術を使用する適用限定集積回路(AS
IC)に内蔵されてもよい。
上記の好ましい実施例の説明は、当業者が本発明を形
成または使用できるように与えられている。当業者はこ
れらの実施例に対する種々の修正を容易に認識し、ここ
に限定された一般的な原理は発明能力を必要とせずに別
の実施例に対して適用されてもよい。以上、本発明はこ
こに示された実施例に限定されるものではなく、ここに
記載された原理および新しい特徴と適合した非常に広い
技術的範囲が提供される。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジェイコブス、ポール・イー アメリカ合衆国、カリフォルニア州 92103、サン・ディエゴ、トーランス・ ストリート 1684 (72)発明者 ガードナー、ウイリアム・アール アメリカ合衆国、カリフォルニア州 92024、エンシニタス、サンタ・フェ・ ドライブ 1006 (72)発明者 リー、チョン・ユー アメリカ合衆国、カリフォルニア州 92124、サン・ディエゴ、カミノ・プラ ヤ・マラガ 5238 (72)発明者 ギルハウセン、クライン・エス アメリカ合衆国、モンタナ州 59715、 ボゼマン、ジャクソン・クリーク・ロー ド 6474 (72)発明者 ラム、エス・キャサリン アメリカ合衆国、カリフォルニア州 92131、サン・ディエゴ、カミニト・ケ ラー 9858 (72)発明者 ツァイ、ミン−チャン アメリカ合衆国、カリフォルニア州 92130、サン・ディエゴ、ミストラル・ プレイス 4427 (56)参考文献 特開 昭61−84700(JP,A) 特開 平1−233500(JP,A) 特開 平2−271400(JP,A)

Claims (50)

    (57)【特許請求の範囲】
  1. 【請求項1】デジタル化されたスピーチサンプルのフレ
    ームの可変速度コード化によるスピーチ信号圧縮方法に
    おいて、 デジタル化されたスピーチサンプルのフレームに対して
    スピーチ活動のレベルを決定するステップと、 前記フレームに対する前記決定されたスピーチ活動のレ
    ベルに基づいて種々の速度からコード化速度を選択する
    ステップと、 前記選択されたコード化速度に対応するコード化フォー
    マットにしたがって前記フレームをコード化するステッ
    プであって、前記種々の速度の内の各速度は異なるコー
    ド化フォーマットを有していて、各コード化フォーマッ
    トがスピーチモデルにしたがって前記デジタル化された
    スピーチサンプルを表す異なる複数のパラメータ信号を
    提供する、コード化するステップと、 前記パラメータ信号のデータパケットを前記フレームに
    対して生成するステップとを含んでいるスピーチ信号圧
    縮方法。
  2. 【請求項2】前記スピーチ活動のレベルを決定するステ
    ップは、 前記デジタル化されたスピーチサンプルのフレームにお
    けるスピーチ活動を測定し、 活動しきい値レベルの予め定められた組の少なくとも1
    つのスピーチ活動しきい値レベルと前記測定されたスピ
    ーチ活動を比較し、 デジタル化されたスピーチサンプルの前のフレームの活
    動のレベルに関して、前記少なくとも1つのスピーチ活
    動しきい値レベルを前記比較に応答して適合的に調節す
    るステップを含んでいる請求項1記載の方法。
  3. 【請求項3】前記フレームに対して予め選択されたコー
    ド化速度を示す速度指令を与え、 前記予め選択されたコード化速度で前記フレームをコー
    ド化するために前記予め選択されたコード化速度を提供
    するように前記選択されたコード化速度を修正するステ
    ップをさらに含んでいる請求項1記載の方法。
  4. 【請求項4】前記予め選択されたコード化速度は予め定
    められた最大速度より小さく、前記方法は、 付加的なデータパケットを提供し、 伝送のために伝送フレーム内において前記データパケッ
    トを前記付加的なデータパケットと組合せるステップを
    さらに含んでいる請求項3記載の方法。
  5. 【請求項5】前記パラメータ信号の前記データパケット
    を生成するステップは、 前記デジタル化されたスピーチサンプルのフレームの線
    形予測係数(LPC)ベクトル信号を表す可変数のビット
    を生成し、前記LPCベクトル信号を表す前記可変数のビ
    ットは、前記測定されたスピーチ活動レベルに応答し、 前記デジタル化されたスピーチサンプルのフレームのピ
    ッチベクトル信号を表す可変数のビットを生成し、前記
    ピッチベクトル信号を表す前記可変数のビットは、前記
    測定されたスピーチ活動レベルに応答し、 前記デジタル化されたスピーチサンプルのフレームのコ
    ードブック励起ベクトル信号を表す可変数のビットを生
    成し、前記コードブック励起ベクトル信号を表す前記可
    変数のビットは、前記測定されたスピーチ活動レベルに
    応答している請求項1記載の方法。
  6. 【請求項6】前記フレームをコード化するステップは、 前記フレームに対して可変数の線形予測係数を生成し、
    前記可変数の前記線形予測係数は前記選択されたコード
    化速度に応答し、 前記フレームに対して可変数のピッチ係数を生成し、前
    記可変数の前記ピッチ係数は前記選択されたコード化速
    度に応答し、 前記フレームに対して可変数のコードブック励起値を生
    成し、前記可変数の前記コードブック励起値は前記選択
    されたコード化速度に応答している請求項1記載の方
    法。
  7. 【請求項7】前記スピーチ活動のレベルを決定するステ
    ップは、前記デジタル化されたスピーチサンプルの値の
    2乗を加算する請求項1記載の方法。
  8. 【請求項8】前記データパケットのためのエラー保護ビ
    ットを生成するステップをさらに含んでいる請求項7記
    載の方法。
  9. 【請求項9】前記データパケットのためのエラー保護ビ
    ットを生成する前記ステップにおいて、前記保護ビット
    の数は前記スピーチ活動レベルのフレームに応答してい
    る請求項8記載の方法。
  10. 【請求項10】前記調節するステップは、 前記スピーチ活動しきい値の少なくとも1つと前記測定
    されたスピーチ活動を比較して、前記フレームスピーチ
    活動が前記スピーチ活動しきい値の前記少なくとも1つ
    を越えた場合に、前記スピーチ活動しきい値の少なくと
    も1つを前記フレームスピーチ活動のレベルに向けて順
    次高めるように増加し、 前記スピーチ活動しきい値の少なくとも1つと前記測定
    されたスピーチ活動を比較して、前記フレームスピーチ
    活動が前記スピーチ活動しきい値の少なくとも1つより
    低い場合に、前記スピーチ活動しきい値の少なくとも1
    つを前記フレームスピーチ活動のレベルまで減少するス
    テップを含んでいる請求項2記載の方法。
  11. 【請求項11】前記コード化速度を選択するステップ
    は、外部速度信号に応答している請求項10記載の方法。
  12. 【請求項12】前記データパケットのためのエラー保護
    ビットを生成する前記ステップは、循環ブロックコード
    にしたがって前記エラー保護ビットの値を決定するステ
    ップを含んでいる請求項8記載の方法。
  13. 【請求項13】予め定められたウインドウ処理機能によ
    って前記デジタル化されたスピーチサンプルを予め乗算
    するステップをさらに含んでいる請求項1記載の方法。
  14. 【請求項14】前記LPC係数をラインスペクトルペア(L
    SP)値に変換するステップをさらに含んでいる請求項1
    記載の方法。
  15. 【請求項15】前記デジタル化されたサンプルの入力フ
    レームは、約20ミリ秒のスピーチに対するデジタル化さ
    れた値を含んでいる請求項1記載の方法。
  16. 【請求項16】前記デジタル化されたサンプルの入力フ
    レームは、約160個のデジタル化されたサンプルを含ん
    でいる請求項1記載の方法。
  17. 【請求項17】前記出力データパケットは、 前記出力データ速度が全速度である場合、LPCデータの
    ための40ビットと、ピッチデータのための40ビットと、
    励起ベクトルデータのための80ビットと、およびエラー
    保護のための11ビットとからなる171ビットを、 前記出力データ速度が1/2速度である場合、LPC情報のた
    めの20ビットと、ピッチ情報のための20ビットと、およ
    び励起ベクトルデータのための40ビットとからなる80ビ
    ットを、 前記出力データ速度が1/4速度である場合、LPC情報のた
    めの10ビットと、ピッチ情報のための10ビットと、およ
    び励起ベクトルデータのための20ビットとからなる40ビ
    ットを、 前記出力データ速度が1/8速度である場合、LPC情報のた
    めの10ビット、および励起ベクトル情報のための6ビッ
    トからなる16ビットを含んでいる請求項1記載の方法。
  18. 【請求項18】可変速度データに音響信号を圧縮する装
    置において、 前記音響信号のデジタル化されたサンプルの入力フレー
    ムに対して音響活動のレベルを決定する手段と、 前記フレーム内の音響活動の前記決定されたレベルに基
    づいて予め定められた種々の速度から出力データ速度を
    選択する手段と、 前記選択された速度に対する1組のコード化フォーマッ
    トの内のあるコード化フォーマットにしたがって前記フ
    レームをコード化して複数のパラメータ信号を提供する
    手段であって、各速度が対応した異なるコード化フォー
    マットを有し、各コード化フォーマットがスピーチモデ
    ルにしたがって前記デジタル化されたスピーチサンプル
    を表す異なった複数のパラメータ信号を提供する手段
    と、 前記選択された速度に対応したデータ速度で、対応出力
    データパケットを前記フレームに与える手段と、 を具備している装置。
  19. 【請求項19】前記出力データパケットは、 デジタル化されたスピーチサンプルの前記フレームのLP
    Cベクトル信号を表す可変数のビットと、 デジタル化されたスピーチサンプルの前記フレームのピ
    ッチベクトル信号を表す可変数のビットと、 デジタル化されたスピーチサンプルの前記フレームのコ
    ードブック励起ベクトル信号を表す可変数のビットとを
    含み、 前記LPCベクトル信号を表す前記可変数のビットが前記
    音響活動のレベルに応答し、 前記ピッチベクトル信号を表す前記可変数のビットが前
    記音響活動のレベルに応答し、 前記コードブック励起ベクトル信号を表す前記可変数の
    ビットが前記音響活動のレベルに応答している請求項18
    記載の音響信号圧縮装置。
  20. 【請求項20】前記音響活動のレベルを決定する手段
    は、 前記入力フレームのエネルギ値を決定する手段と、 前記入力フレームエネルギを前記少なくとも1つの音響
    活動しきい値と比較する手段と、 前記入力フレーム活動が前記少なくとも1つの音響活動
    しきい値のそれぞれ対応するものを越えたときに指示を
    与える手段とを具備している請求項18記載の音響信号圧
    縮装置。
  21. 【請求項21】前記少なくとも1つの音響活動しきい値
    を適合的に調節する手段をさらに具備している請求項20
    記載の装置。
  22. 【請求項22】前記入力フレームの前記エネルギ値を決
    定する手段は、前記フレームのデジタル化された音響サ
    ンプルを2乗する2乗手段と、 前記フレームのデジタル化された音響サンプルの2乗し
    たものを合計する合計手段とを具備している請求項20記
    載の装置。
  23. 【請求項23】前記音響活動のレベルを決定する手段
    は、 前記音響信号のデジタル化されたサンプルの前記入力フ
    レームに対して1組の線形予測係数を計算する手段と、 前記線形予測係数の少なくとも1つにしたがって前記音
    響活動のレベルを決定する手段とを具備している請求項
    18記載の装置。
  24. 【請求項24】前記選択された出力データ速度に応答し
    て前記データパケットに対するエラー保護ビットを供給
    する手段をさらに具備している請求項18記載の装置。
  25. 【請求項25】前記エラー保護ビットを供給する手段
    は、循環ブロックコードにしたがって前記エラー保護ビ
    ットの値を供給する請求項24記載の装置。
  26. 【請求項26】ラインスペクトルペア(LSP)値にLPC係
    数を変換する手段をさらに具備している請求項18記載の
    装置。
  27. 【請求項27】前記種々の速度は、全速度、1/2速度、1
    /4速度および1/8速度を含んでいる請求項18記載の装
    置。
  28. 【請求項28】前記種々の速度は、16Kbps,8Kbps,4Kbps
    および2Kbpsを含んでいる請求項18記載の装置。
  29. 【請求項29】前記種々の速度は、8Kbps,4Kbps,2Kbps
    および1Kbpsを含んでいる請求項18記載の装置。
  30. 【請求項30】可変速度データに音響信号を圧縮する回
    路において、 前記音響信号のデジタル化されたサンプルの入力フレー
    ムに対して音響活動のレベルを決定する回路と、 前記フレーム内の前記決定された音響活動のレベルに基
    づいて予め定められた種々の速度から出力データ速度を
    選択する回路と、 複数のパラメータ信号を供給するために前記選択された
    速度に対して1組のコード化フォーマットの内のあるコ
    ード化フォーマットにしたがって前記フレームをコード
    化する回路であって、各速度は対応した異なるコード化
    フォーマットを有し、各コード化フォーマットがスピー
    チモデルにしたがって前記デジタル化されたスピーチサ
    ンプルを表す複数の異なるパラメータ信号を供給する回
    路と、 前記選択された速度に対応したデータ速度で、前記フレ
    ームに、対応データパケットを供給する回路と、 を具備している音響信号圧縮回路。
  31. 【請求項31】前記音響活動のレベルを決定する回路
    は、 前記入力フレームに対してエネルギ値を決定する回路
    と、 前記入力フレームエネルギ値を前記少なくとも1つの音
    響活動しきい値と比較する回路と、 前記入力フレーム活動が前記少なくとも1つの音響活動
    しきい値のそれぞれ対応するものを越えたときに指示を
    与える回路とを具備している請求項30記載の回路。
  32. 【請求項32】前記音響活動のレベルを決定する回路
    は、前記少なくとも1つの音響活動しきい値を適合的に
    調節する回路をさらに具備している請求項31記載の回
    路。
  33. 【請求項33】前記入力フレームの前記エネルギ値を決
    定する回路は、前記デジタル化されたサンプルの値の2
    乗したものを合計することによって前記エネルギ値を決
    定する請求項31記載の回路。
  34. 【請求項34】前記音響活動のレベルを決定する回路
    は、前記入力フレームに対する1組の線形予測係数を計
    算し、前記線形予測係数の少なくとも1つにしたがって
    前記音響活動のレベルを決定することによって前記エネ
    ルギ値を決定する請求項31記載の回路。
  35. 【請求項35】前記デジタル化されたサンプルの入力フ
    レームは、約20ミリ秒の持続期間に対するデジタル化さ
    れたスピーチを含んでいる請求項30記載の回路。
  36. 【請求項36】前記デジタル化されたサンプルの入力フ
    レームは、160個のデジタル化されたサンプルを含んで
    いる請求項30記載の回路。
  37. 【請求項37】前記選択された出力データ速度に応答し
    て前記データパケットに対してエラー保護ビットを供給
    する手段をさらに具備している請求項30記載の回路。
  38. 【請求項38】循環ブロックコードにしたがって前記エ
    ラー保護ビットの値を決定する手段をさらに具備してい
    る請求項37記載の回路。
  39. 【請求項39】前記循環ブロックコードは、 1+x3+x5+x6+x8+x9+x10の発生器の多項式にした
    がって動作する請求項38記載の回路。
  40. 【請求項40】予め定められたウインドウ処理機能によ
    って前記デジタル化されたサンプルを予め乗算する手段
    をさらに具備している請求項30記載の回路。
  41. 【請求項41】予め定められたウインドウ処理機能は、
    ハミングウインドウである請求項40記載の回路。
  42. 【請求項42】前記種々の速度は、全速度、1/2速度、1
    /4速度および1/8速度を含んでいる請求項30記載の回
    路。
  43. 【請求項43】前記種々の速度は、16Kbps,8Kbps,4Kbps
    および2Kbpsを含んでいる請求項30記載の回路。
  44. 【請求項44】前記種々の速度は、8Kbps,4Kbps,2Kbps
    および1Kbpsを含んでいる請求項30記載の装置。
  45. 【請求項45】前記出力データパケットは、 デジタル化されたスピーチサンプルの前記フレームのLP
    Cベクトル信号を表す可変数のビットと、 デジタル化されたスピーチサンプルの前記フレームのピ
    ッチベクトル信号を表す可変数のビットと、 デジタル化されたスピーチサンプルの前記フレームのコ
    ードブック励起ベクトル信号を表す可変数のビットとを
    含み、 前記LPCベクトル信号を表す前記可変数のビットが前記
    音響活動のレベルに応答し、 前記ピッチベクトル信号を表す前記可変数のビットが前
    記音響活動のレベルに応答し、 前記コードブック励起ベクトル信号を表す前記可変数の
    ビットが前記音響活動のレベルに応答している請求項30
    記載の回路。
  46. 【請求項46】前記出力データパケットはエラー保護の
    ための可変数のビットをさらに含み、前記エラー保護の
    ための可変数のビットは前記音響活動のレベルに応答し
    ている請求項45記載の回路。
  47. 【請求項47】前記出力データパケットは、 前記出力データ速度が全速度である場合、LPCデータの
    ための40ビットと、ピッチデータのための40ビットと、
    励起ベクトルデータのための80ビットと、およびエラー
    保護のための11ビットとからなる171ビットを、 前記出力データ速度が1/2速度である場合、LPC情報のた
    めの20ビットと、ピッチ情報のための20ビットと、およ
    び励起ベクトルデータのための40ビットとからなる80ビ
    ットを、 前記出力データ速度が1/4速度である場合、LPC情報のた
    めの10ビットと、ピッチ情報のための10ビットと、およ
    び励起ベクトルデータのための20ビットとからなる40ビ
    ットを、 前記出力データ速度が1/8速度である場合、LPC情報のた
    めの10ビット、および励起ベクトル情報のための6ビッ
    トからなる16ビットを含んでいる請求項30記載の回路。
  48. 【請求項48】前記データ速度を選択する回路は、外部
    速度信号に応答している請求項30記載の回路。
  49. 【請求項49】LPC係数をラインスペクトルペア(LSP)
    値に変換する手段をさらに含んでいる請求項30記載の回
    路。
  50. 【請求項50】デジタル化されたスピーチサンプルのフ
    レームの可変速度コード化によるスピーチ信号圧縮方法
    において、 ウインドウ処理機能によってデジタル化されたスピーチ
    サンプルのフレームのシーケンス中の前記デジタル化さ
    れたスピーチサンプルのあるフレームを乗算して、スピ
    ーチデータのウインドウ処理されたフレームを提供する
    ステップと、 前記スピーチデータのウインドウ処理されたフレームか
    ら1組の自己相関係数を計算するステップと、 前記1組の自己相関係数からコード化速度を決定するス
    テップと、 1組の線形予測コード化(LPC)係数を前記1組の自己
    相関係数から計算するステップと、 前記1組のLPC係数を1組のラインスペクトルペア値に
    変換するステップと、速度指令および前記コード化速度
    にしたがって前記1組のラインスペクトルペア(LSP)
    係数を量子化するステップと、 予め定められた1組のピッチ値からピッチ値を選択し
    て、デジタル化されたスピーチサンプルの各フレーム中
    の各ピッチサブフレームに選択されたピッチ値を与える
    ステップと、 前記コード化速度および前記速度指令にしたがって前記
    選択されたピッチ値を量子化するステップと、 予め定められた1組のピッチ値からコードブック値を選
    択して、ピッチフレームに選択されたピッチ値を与える
    ステップと、 前記コード化速度および前記速度指令にしたがって前記
    選択されたコードブック値を量子化するステップと、 前記量子化されたラインスペクトルペア値と、量子化さ
    れ選択されたピッチ値と、および量子化され選択された
    コードブック値とを含む出力データパケットを生成する
    ステップと、 を含んでいるスピーチ信号圧縮方法。
JP50090293A 1991-06-11 1992-06-03 可変速度ボコーダ Expired - Lifetime JP3432822B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US71366191A 1991-06-11 1991-06-11
US713,661 1991-06-11
PCT/US1992/004605 WO1992022891A1 (en) 1991-06-11 1992-06-03 Variable rate vocoder

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2001144031A Division JP3566669B2 (ja) 1991-06-11 2001-05-14 フレームエラーをマスクする方法および装置
JP2001343016A Division JP2002202800A (ja) 1991-06-11 2001-11-08 背景ノイズエネルギーレベルを見積もる方法と装置

Publications (2)

Publication Number Publication Date
JPH06511320A JPH06511320A (ja) 1994-12-15
JP3432822B2 true JP3432822B2 (ja) 2003-08-04

Family

ID=24866989

Family Applications (7)

Application Number Title Priority Date Filing Date
JP50090293A Expired - Lifetime JP3432822B2 (ja) 1991-06-11 1992-06-03 可変速度ボコーダ
JP2001144031A Expired - Lifetime JP3566669B2 (ja) 1991-06-11 2001-05-14 フレームエラーをマスクする方法および装置
JP2001343016A Pending JP2002202800A (ja) 1991-06-11 2001-11-08 背景ノイズエネルギーレベルを見積もる方法と装置
JP2003172114A Expired - Lifetime JP3751957B2 (ja) 1991-06-11 2003-06-17 エンコードまたはデコードの方法および装置
JP2005018692A Expired - Lifetime JP3955600B2 (ja) 1991-06-11 2005-01-26 背景ノイズエネルギーレベルを見積もる方法と装置
JP2005273821A Expired - Lifetime JP3964915B2 (ja) 1991-06-11 2005-09-21 エンコードまたはデコードの方法および装置
JP2006108635A Expired - Lifetime JP4191746B2 (ja) 1991-06-11 2006-04-11 背景ノイズエネルギーレベルを見積もる方法と装置

Family Applications After (6)

Application Number Title Priority Date Filing Date
JP2001144031A Expired - Lifetime JP3566669B2 (ja) 1991-06-11 2001-05-14 フレームエラーをマスクする方法および装置
JP2001343016A Pending JP2002202800A (ja) 1991-06-11 2001-11-08 背景ノイズエネルギーレベルを見積もる方法と装置
JP2003172114A Expired - Lifetime JP3751957B2 (ja) 1991-06-11 2003-06-17 エンコードまたはデコードの方法および装置
JP2005018692A Expired - Lifetime JP3955600B2 (ja) 1991-06-11 2005-01-26 背景ノイズエネルギーレベルを見積もる方法と装置
JP2005273821A Expired - Lifetime JP3964915B2 (ja) 1991-06-11 2005-09-21 エンコードまたはデコードの方法および装置
JP2006108635A Expired - Lifetime JP4191746B2 (ja) 1991-06-11 2006-04-11 背景ノイズエネルギーレベルを見積もる方法と装置

Country Status (21)

Country Link
US (3) US5414796A (ja)
EP (8) EP0588932B1 (ja)
JP (7) JP3432822B2 (ja)
CN (8) CN1091535C (ja)
AT (4) ATE208945T1 (ja)
AU (3) AU671952B2 (ja)
BR (1) BR9206143A (ja)
CA (6) CA2483322C (ja)
DE (4) DE69233794D1 (ja)
DK (2) DK0588932T3 (ja)
ES (4) ES2348319T3 (ja)
FI (5) FI120425B (ja)
HK (3) HK1014796A1 (ja)
HU (1) HU215861B (ja)
IL (4) IL113986A (ja)
MX (1) MX9202808A (ja)
NO (1) NO319559B1 (ja)
RU (1) RU2107951C1 (ja)
SG (1) SG70558A1 (ja)
WO (1) WO1992022891A1 (ja)
ZA (1) ZA924082B (ja)

Families Citing this family (499)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010050943A1 (en) * 1989-08-03 2001-12-13 Mahany Ronald L. Radio frequency communication network having adaptive communication parameters
US7606575B2 (en) 1988-08-04 2009-10-20 Broadcom Corporation Remote radio data communication system with data rate switching
US6693951B1 (en) 1990-06-25 2004-02-17 Qualcomm Incorporated System and method for generating signal waveforms in a CDMA cellular telephone system
DE69233794D1 (de) * 1991-06-11 2010-09-23 Qualcomm Inc Vocoder mit veränderlicher Bitrate
US5355450A (en) * 1992-04-10 1994-10-11 Avid Technology, Inc. Media composer with adjustable source material compression
AU3274593A (en) * 1991-12-13 1993-07-19 Avid Technology, Inc. Quantization table adjustment
SE469764B (sv) * 1992-01-27 1993-09-06 Ericsson Telefon Ab L M Saett att koda en samplad talsignalvektor
TW224191B (ja) * 1992-01-28 1994-05-21 Qualcomm Inc
CA2105269C (en) * 1992-10-09 1998-08-25 Yair Shoham Time-frequency interpolation with application to low rate speech coding
FI95086C (fi) * 1992-11-26 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin tehokkaaksi koodaamiseksi
US5617423A (en) 1993-01-08 1997-04-01 Multi-Tech Systems, Inc. Voice over data modem with selectable voice compression
US5812534A (en) 1993-01-08 1998-09-22 Multi-Tech Systems, Inc. Voice over data conferencing for a computer-based personal communications system
US5453986A (en) 1993-01-08 1995-09-26 Multi-Tech Systems, Inc. Dual port interface for a computer-based multifunction personal communication system
US5535204A (en) 1993-01-08 1996-07-09 Multi-Tech Systems, Inc. Ringdown and ringback signalling for a computer-based multifunction personal communications system
US6009082A (en) 1993-01-08 1999-12-28 Multi-Tech Systems, Inc. Computer-based multifunction personal communication system with caller ID
US5546395A (en) 1993-01-08 1996-08-13 Multi-Tech Systems, Inc. Dynamic selection of compression rate for a voice compression algorithm in a voice over data modem
US5864560A (en) 1993-01-08 1999-01-26 Multi-Tech Systems, Inc. Method and apparatus for mode switching in a voice over data computer-based personal communications system
US5452289A (en) 1993-01-08 1995-09-19 Multi-Tech Systems, Inc. Computer-based multifunction personal communications system
US5754589A (en) 1993-01-08 1998-05-19 Multi-Tech Systems, Inc. Noncompressed voice and data communication over modem for a computer-based multifunction personal communications system
US5657423A (en) * 1993-02-22 1997-08-12 Texas Instruments Incorporated Hardware filter circuit and address circuitry for MPEG encoded data
WO1994024823A1 (en) * 1993-04-16 1994-10-27 Data Translation, Inc. Adaptive video compression using variable quantization
JPH08511915A (ja) * 1993-04-16 1996-12-10 データ トランスレイション,インコーポレイテッド 適応型画像伸張
FI96248C (fi) * 1993-05-06 1996-05-27 Nokia Mobile Phones Ltd Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin
US5659659A (en) * 1993-07-26 1997-08-19 Alaris, Inc. Speech compressor using trellis encoding and linear prediction
ZA946674B (en) * 1993-09-08 1995-05-02 Qualcomm Inc Method and apparatus for determining the transmission data rate in a multi-user communication system
US5649299A (en) * 1993-10-27 1997-07-15 Motorola, Inc. Apparatus and method for adapting a digital radiotelephone system to increased subscriber traffic
US6088590A (en) 1993-11-01 2000-07-11 Omnipoint Corporation Method and system for mobile controlled handoff and link maintenance in spread spectrum communication
US6005856A (en) 1993-11-01 1999-12-21 Omnipoint Corporation Communication protocol for spread spectrum wireless communication system
IL111469A0 (en) 1993-11-01 1994-12-29 Omnipoint Corp Despreading/demodulating direct sequence spread spectrum signals
US6094575A (en) 1993-11-01 2000-07-25 Omnipoint Corporation Communication system and method
JP3182032B2 (ja) * 1993-12-10 2001-07-03 株式会社日立国際電気 音声符号化通信方式及びその装置
US5621852A (en) * 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
US5784532A (en) * 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
EP0702863B1 (en) * 1994-02-17 2004-10-20 Motorola, Inc. Method and apparatus for controlling encoding rate in a communication system
US5574825A (en) * 1994-03-14 1996-11-12 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
CA2142391C (en) * 1994-03-14 2001-05-29 Juin-Hwey Chen Computational complexity reduction during frame erasure or packet loss
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss
US5757801A (en) 1994-04-19 1998-05-26 Multi-Tech Systems, Inc. Advanced priority statistical multiplexer
US5682386A (en) 1994-04-19 1997-10-28 Multi-Tech Systems, Inc. Data/voice/fax compression multiplexer
FI98162C (fi) * 1994-05-30 1997-04-25 Tecnomen Oy HMM-malliin perustuva puheentunnistusmenetelmä
US5602961A (en) * 1994-05-31 1997-02-11 Alaris, Inc. Method and apparatus for speech compression using multi-mode code excited linear predictive coding
US5638412A (en) 1994-06-15 1997-06-10 Qualcomm Incorporated Method for providing service and rate negotiation in a mobile communication system
US5603096A (en) * 1994-07-11 1997-02-11 Qualcomm Incorporated Reverse link, closed loop power control in a code division multiple access system
TW271524B (ja) * 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5953370A (en) 1994-09-09 1999-09-14 Omnipoint Corporation Apparatus for receiving and correlating a spread spectrum signal
US5754584A (en) 1994-09-09 1998-05-19 Omnipoint Corporation Non-coherent spread-spectrum continuous-phase modulation communication system
US5627856A (en) 1994-09-09 1997-05-06 Omnipoint Corporation Method and apparatus for receiving and despreading a continuous phase-modulated spread spectrum signal using self-synchronizing correlators
US5680414A (en) 1994-09-09 1997-10-21 Omnipoint Corporation Synchronization apparatus and method for spread spectrum receiver
US5692007A (en) 1994-09-09 1997-11-25 Omnipoint Corporation Method and apparatus for differential phase encoding and decoding in spread-spectrum communication systems with continuous-phase modulation
US5648982A (en) 1994-09-09 1997-07-15 Omnipoint Corporation Spread spectrum transmitter
US5856998A (en) 1994-09-09 1999-01-05 Omnipoint Corporation Method and apparatus for correlating a continuous phase modulated spread spectrum signal
US5832028A (en) 1994-09-09 1998-11-03 Omnipoint Corporation Method and apparatus for coherent serial correlation of a spread spectrum signal
US5629956A (en) 1994-09-09 1997-05-13 Omnipoint Corporation Method and apparatus for reception and noncoherent serial correlation of a continuous phase modulated signal
US5659574A (en) 1994-09-09 1997-08-19 Omnipoint Corporation Multi-bit correlation of continuous phase modulated signals
US5963586A (en) 1994-09-09 1999-10-05 Omnipoint Corporation Method and apparatus for parallel noncoherent correlation of a spread spectrum signal
US5610940A (en) 1994-09-09 1997-03-11 Omnipoint Corporation Method and apparatus for noncoherent reception and correlation of a continous phase modulated signal
US5757847A (en) 1994-09-09 1998-05-26 Omnipoint Corporation Method and apparatus for decoding a phase encoded signal
US5754585A (en) 1994-09-09 1998-05-19 Omnipoint Corporation Method and apparatus for serial noncoherent correlation of a spread spectrum signal
US5881100A (en) 1994-09-09 1999-03-09 Omnipoint Corporation Method and apparatus for coherent correlation of a spread spectrum signal
US6141353A (en) * 1994-09-15 2000-10-31 Oki Telecom, Inc. Subsequent frame variable data rate indication method for various variable data rate systems
US5537410A (en) * 1994-09-15 1996-07-16 Oki Telecom Subsequent frame variable data rate indication method
JPH08102687A (ja) * 1994-09-29 1996-04-16 Yamaha Corp 音声送受信方式
ATE213864T1 (de) * 1994-10-05 2002-03-15 Advanced Micro Devices Inc Vorrichtung und verfahren zur sprachsignalanalyse zur parameterbestimmung von sprachsignalmerkmalen
US5546448A (en) * 1994-11-10 1996-08-13 Multi-Tech Systems, Inc. Apparatus and method for a caller ID modem interface
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
JPH08179796A (ja) * 1994-12-21 1996-07-12 Sony Corp 音声符号化方法
FR2729246A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
US5784403A (en) * 1995-02-03 1998-07-21 Omnipoint Corporation Spread spectrum correlation using saw device
JP3303580B2 (ja) * 1995-02-23 2002-07-22 日本電気株式会社 音声符号化装置
US6292476B1 (en) 1997-04-16 2001-09-18 Qualcomm Inc. Method and apparatus for providing variable rate data in a communications system using non-orthogonal overflow channels
ZA961025B (en) * 1995-02-28 1996-07-16 Qualcomm Inc Method and apparatus for providing variable rate data in a communications system using non-orthogonal overflow channels
US5991725A (en) * 1995-03-07 1999-11-23 Advanced Micro Devices, Inc. System and method for enhanced speech quality in voice storage and retrieval systems
US5699478A (en) * 1995-03-10 1997-12-16 Lucent Technologies Inc. Frame erasure compensation technique
JPH08263099A (ja) * 1995-03-23 1996-10-11 Toshiba Corp 符号化装置
US6137840A (en) 1995-03-31 2000-10-24 Qualcomm Incorporated Method and apparatus for performing fast power control in a mobile communication system
TW347616B (en) 1995-03-31 1998-12-11 Qualcomm Inc Method and apparatus for performing fast power control in a mobile communication system a method and apparatus for controlling transmission power in a mobile communication system is disclosed.
US6977967B1 (en) 1995-03-31 2005-12-20 Qualcomm Incorporated Method and apparatus for performing fast power control in a mobile communication system
US5548253A (en) * 1995-04-17 1996-08-20 Omnipoint Corporation Spectrally efficient quadrature amplitude modulator
US5508708A (en) * 1995-05-08 1996-04-16 Motorola, Inc. Method and apparatus for location finding in a CDMA system
JP2728122B2 (ja) * 1995-05-23 1998-03-18 日本電気株式会社 無音圧縮音声符号化復号化装置
US5959980A (en) 1995-06-05 1999-09-28 Omnipoint Corporation Timing adjustment control for efficient time division duplex communication
US5689502A (en) * 1995-06-05 1997-11-18 Omnipoint Corporation Efficient frequency division duplex communication system with interleaved format and timing adjustment control
US5802046A (en) * 1995-06-05 1998-09-01 Omnipoint Corporation Efficient time division duplex communication system with interleaved format and timing adjustment control
US6356607B1 (en) 1995-06-05 2002-03-12 Omnipoint Corporation Preamble code structure and detection method and apparatus
US5745484A (en) * 1995-06-05 1998-04-28 Omnipoint Corporation Efficient communication system using time division multiplexing and timing adjustment control
US6526038B1 (en) * 1995-06-07 2003-02-25 Telcordia Technologies, Inc. Periodic wireless broadcast
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
US7929498B2 (en) 1995-06-30 2011-04-19 Interdigital Technology Corporation Adaptive forward power control and adaptive reverse power control for spread-spectrum communications
US7020111B2 (en) 1996-06-27 2006-03-28 Interdigital Technology Corporation System for using rapid acquisition spreading codes for spread-spectrum communications
ZA965340B (en) 1995-06-30 1997-01-27 Interdigital Tech Corp Code division multiple access (cdma) communication system
US6885652B1 (en) 1995-06-30 2005-04-26 Interdigital Technology Corporation Code division multiple access (CDMA) communication system
FI100157B (fi) * 1995-07-12 1997-09-30 Nokia Mobile Phones Ltd Muuttuvanopeuksiset piirikytketyt siirtopalvelut TDMA-pohjaisissa solu kkojärjestelmissä
US6041046A (en) * 1995-07-14 2000-03-21 Omnipoint Corporation Cyclic time hopping in time division multiple access communication system
US5754733A (en) * 1995-08-01 1998-05-19 Qualcomm Incorporated Method and apparatus for generating and encoding line spectral square roots
FR2737948B1 (fr) * 1995-08-16 1997-10-17 Alcatel Mobile Comm France Dispositif de commande de volume sonore pour recepteur de signaux de parole codes par blocs
JP3522012B2 (ja) * 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
EP0810757B1 (en) * 1995-08-31 2005-05-25 NTT DoCoMo, Inc. Atm transmission method having silence compression controlling function, and system, transmitter and receiver using the method
US5950164A (en) * 1995-09-29 1999-09-07 Olympus Optical Co., Ltd. Voice recording apparatus capable of displaying remaining recording capacity of memory according to encoding bit rates
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
JP3680380B2 (ja) * 1995-10-26 2005-08-10 ソニー株式会社 音声符号化方法及び装置
JPH09152896A (ja) * 1995-11-30 1997-06-10 Oki Electric Ind Co Ltd 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5822721A (en) * 1995-12-22 1998-10-13 Iterated Systems, Inc. Method and apparatus for fractal-excited linear predictive coding of digital signals
US5737716A (en) * 1995-12-26 1998-04-07 Motorola Method and apparatus for encoding speech using neural network technology for speech classification
US5867763A (en) * 1996-02-08 1999-02-02 Qualcomm Incorporated Method and apparatus for integration of a wireless communication system with a cable T.V. system
US5839052A (en) * 1996-02-08 1998-11-17 Qualcom Incorporated Method and apparatus for integration of a wireless communication system with a cable television system
JPH09230896A (ja) * 1996-02-28 1997-09-05 Sony Corp 音声合成装置
US5754537A (en) * 1996-03-08 1998-05-19 Telefonaktiebolaget L M Ericsson (Publ) Method and system for transmitting background noise data
WO1997036397A1 (en) * 1996-03-27 1997-10-02 Motorola Inc. Method and apparatus for providing a multi-party speech connection for use in a wireless communication system
SE506341C2 (sv) * 1996-04-10 1997-12-08 Ericsson Telefon Ab L M Metod och anordning för rekonstruktion av en mottagen talsignal
GB2312360B (en) * 1996-04-12 2001-01-24 Olympus Optical Co Voice signal coding apparatus
US5708757A (en) * 1996-04-22 1998-01-13 France Telecom Method of determining parameters of a pitch synthesis filter in a speech coder, and speech coder implementing such method
US6205190B1 (en) 1996-04-29 2001-03-20 Qualcomm Inc. System and method for reducing interference generated by a CDMA communications device
US6047254A (en) * 1996-05-15 2000-04-04 Advanced Micro Devices, Inc. System and method for determining a first formant analysis filter and prefiltering a speech signal for improved pitch estimation
US5937374A (en) * 1996-05-15 1999-08-10 Advanced Micro Devices, Inc. System and method for improved pitch estimation which performs first formant energy removal for a frame using coefficients from a prior frame
JP3092652B2 (ja) * 1996-06-10 2000-09-25 日本電気株式会社 音声再生装置
US6766176B1 (en) 1996-07-23 2004-07-20 Qualcomm Incorporated Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone
JP3266819B2 (ja) * 1996-07-30 2002-03-18 株式会社エイ・ティ・アール人間情報通信研究所 周期信号変換方法、音変換方法および信号分析方法
US5883927A (en) * 1996-07-31 1999-03-16 Nextwave Telecom, Inc. Digital wireless telecommunication device for reduced interference with hearing aids
JPH1049199A (ja) * 1996-08-02 1998-02-20 Nec Corp 無音圧縮音声符号化復号化装置
US5726983A (en) * 1996-08-09 1998-03-10 Motorola, Inc. Communication device with variable frame processing time
US5812968A (en) * 1996-08-28 1998-09-22 Ericsson, Inc. Vocoder apparatus using the link margin
US5881053A (en) * 1996-09-13 1999-03-09 Qualcomm Incorporated Method for a wireless communications channel
SE507370C2 (sv) * 1996-09-13 1998-05-18 Ericsson Telefon Ab L M Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare
US6205130B1 (en) 1996-09-25 2001-03-20 Qualcomm Incorporated Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters
JP2001501790A (ja) * 1996-09-25 2001-02-06 クゥアルコム・インコーポレイテッド 復号された音声パラメータを用いる移動電話で受信された不良データパケットの検出を行う方法およびその装置
US7788092B2 (en) * 1996-09-25 2010-08-31 Qualcomm Incorporated Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters
US6014622A (en) 1996-09-26 2000-01-11 Rockwell Semiconductor Systems, Inc. Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
US5954834A (en) * 1996-10-09 1999-09-21 Ericsson Inc. Systems and methods for communicating desired audio information over a communications medium
US5905794A (en) * 1996-10-15 1999-05-18 Multi-Tech Systems, Inc. Caller identification interface using line reversal detection
US6496543B1 (en) 1996-10-29 2002-12-17 Qualcomm Incorporated Method and apparatus for providing high speed data communications in a cellular environment
US5781593A (en) * 1996-11-14 1998-07-14 Omnipoint Corporation Methods and apparatus for vocoder synchronization in mobile communication network
US6141373A (en) * 1996-11-15 2000-10-31 Omnipoint Corporation Preamble code structure and detection method and apparatus
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
US6172965B1 (en) * 1996-12-23 2001-01-09 Nortel Networks Limited Duplex transmission scheme
JP2856185B2 (ja) * 1997-01-21 1999-02-10 日本電気株式会社 音声符号化復号化システム
EP0895688B1 (en) * 1997-01-23 2006-02-15 Motorola, Inc. Apparatus and method for non-linear processing in a communication system
US6335922B1 (en) 1997-02-11 2002-01-01 Qualcomm Incorporated Method and apparatus for forward link rate scheduling
US7751370B2 (en) * 2001-07-13 2010-07-06 Qualcomm Incorporated Method and apparatus for forward link rate scheduling
US6014375A (en) * 1997-02-13 2000-01-11 Ericsson Inc. TDMA radio protocol with adaptive vocoder selection
JP3067676B2 (ja) * 1997-02-13 2000-07-17 日本電気株式会社 Lspの予測符号化装置及び方法
US5832443A (en) * 1997-02-25 1998-11-03 Alaris, Inc. Method and apparatus for adaptive audio compression and decompression
US6104993A (en) * 1997-02-26 2000-08-15 Motorola, Inc. Apparatus and method for rate determination in a communication system
WO1998038764A1 (de) * 1997-02-27 1998-09-03 Siemens Aktiengesellschaft Verfahren und anordnung zur rahmenfehlerdetektion zwecks fehlerverdeckung insbesondere bei gsm übertragungen
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
US6282228B1 (en) 1997-03-20 2001-08-28 Xircom, Inc. Spread spectrum codes for use in communication
US6480521B1 (en) * 1997-03-26 2002-11-12 Qualcomm Incorporated Method and apparatus for transmitting high speed data in a spread spectrum communications system
US5907822A (en) * 1997-04-04 1999-05-25 Lincom Corporation Loss tolerant speech decoder for telecommunications
WO1998045833A1 (en) * 1997-04-07 1998-10-15 Koninklijke Philips Electronics N.V. Variable bitrate speech transmission system
KR100198476B1 (ko) * 1997-04-23 1999-06-15 윤종용 노이즈에 견고한 스펙트럼 포락선 양자화기 및 양자화 방법
US6014623A (en) * 1997-06-12 2000-01-11 United Microelectronics Corp. Method of encoding synthetic speech
US6075792A (en) * 1997-06-16 2000-06-13 Interdigital Technology Corporation CDMA communication system which selectively allocates bandwidth upon demand
US6032116A (en) * 1997-06-27 2000-02-29 Advanced Micro Devices, Inc. Distance measure in a speech recognition system for speech recognition using frequency shifting factors to compensate for input signal frequency shifts
US6003003A (en) * 1997-06-27 1999-12-14 Advanced Micro Devices, Inc. Speech recognition system having a quantizer using a single robust codebook designed at multiple signal to noise ratios
US6044343A (en) * 1997-06-27 2000-03-28 Advanced Micro Devices, Inc. Adaptive speech recognition with selective input data to a speech classifier
US6175590B1 (en) 1997-08-08 2001-01-16 Qualcomm Inc. Method and apparatus for determining the rate of received data in a variable rate communication system
US6097972A (en) * 1997-08-29 2000-08-01 Qualcomm Incorporated Method and apparatus for processing power control signals in CDMA mobile telephone system
WO1999012155A1 (en) * 1997-09-30 1999-03-11 Qualcomm Incorporated Channel gain modification system and method for noise reduction in voice communication
US6058359A (en) * 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
US5898696A (en) * 1997-09-05 1999-04-27 Motorola, Inc. Method and system for controlling an encoding rate in a variable rate communication system
US6049537A (en) * 1997-09-05 2000-04-11 Motorola, Inc. Method and system for controlling speech encoding in a communication system
US6920150B1 (en) 1997-09-30 2005-07-19 Lucent Technologies Inc. Adaptive communications transcoding and error control
US5897613A (en) * 1997-10-08 1999-04-27 Lucent Technologies Inc. Efficient transmission of voice silence intervals
US6067515A (en) * 1997-10-27 2000-05-23 Advanced Micro Devices, Inc. Split matrix quantization with split vector quantization error compensation and selective enhanced processing for robust speech recognition
US6070136A (en) * 1997-10-27 2000-05-30 Advanced Micro Devices, Inc. Matrix quantization with vector quantization error compensation for robust speech recognition
US5953695A (en) * 1997-10-29 1999-09-14 Lucent Technologies Inc. Method and apparatus for synchronizing digital speech communications
US9118387B2 (en) 1997-11-03 2015-08-25 Qualcomm Incorporated Pilot reference transmission for a wireless communication system
US7184426B2 (en) * 2002-12-12 2007-02-27 Qualcomm, Incorporated Method and apparatus for burst pilot for a time division multiplex system
US6563803B1 (en) * 1997-11-26 2003-05-13 Qualcomm Incorporated Acoustic echo canceller
US6044339A (en) * 1997-12-02 2000-03-28 Dspc Israel Ltd. Reduced real-time processing in stochastic celp encoding
DE19753697B4 (de) * 1997-12-03 2006-04-27 Siemens Ag Verfahren und Funkstation zur Datenübertragung in einem Kommunikationssystem
US6049765A (en) * 1997-12-22 2000-04-11 Lucent Technologies Inc. Silence compression for recorded voice messages
US6104994A (en) * 1998-01-13 2000-08-15 Conexant Systems, Inc. Method for speech coding under background noise conditions
JPH11215006A (ja) * 1998-01-29 1999-08-06 Olympus Optical Co Ltd ディジタル音声信号の送信装置及び受信装置
US6799159B2 (en) * 1998-02-02 2004-09-28 Motorola, Inc. Method and apparatus employing a vocoder for speech processing
US6381569B1 (en) 1998-02-04 2002-04-30 Qualcomm Incorporated Noise-compensated speech recognition templates
US6603751B1 (en) * 1998-02-13 2003-08-05 Qualcomm Incorporated Method and system for performing a handoff in a wireless communication system, such as a hard handoff
US6545989B1 (en) 1998-02-19 2003-04-08 Qualcomm Incorporated Transmit gating in a wireless communication system
US6104991A (en) * 1998-02-27 2000-08-15 Lucent Technologies, Inc. Speech encoding and decoding system which modifies encoding and decoding characteristics based on an audio signal
FI113571B (fi) 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
US6043763A (en) * 1998-03-12 2000-03-28 Liquid Audio, Inc. Lossless data compression with low complexity
US6118392A (en) * 1998-03-12 2000-09-12 Liquid Audio Inc. Lossless data compression with low complexity
US6121904A (en) * 1998-03-12 2000-09-19 Liquid Audio, Inc. Lossless data compression with low complexity
US6125348A (en) * 1998-03-12 2000-09-26 Liquid Audio Inc. Lossless data compression with low complexity
US6028541A (en) * 1998-03-12 2000-02-22 Liquid Audio Inc. Lossless data compression with low complexity
US6169906B1 (en) * 1998-03-24 2001-01-02 Motorola, Inc. Method of transmitting messages in a dispatch call
US20030194033A1 (en) 1998-05-21 2003-10-16 Tiedemann Edward G. Method and apparatus for coordinating transmission of short messages with hard handoff searches in a wireless communications system
DE59911334D1 (de) * 1998-06-03 2005-01-27 Siemens Ag Verfahren und funkgerät zur übertragung von nachrichten
US6577645B2 (en) 1998-06-03 2003-06-10 Siemens Aktiengesellschaft Method and radio set for transmitting messages
US6141639A (en) * 1998-06-05 2000-10-31 Conexant Systems, Inc. Method and apparatus for coding of signals containing speech and background noise
US6810377B1 (en) * 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
JP3273599B2 (ja) * 1998-06-19 2002-04-08 沖電気工業株式会社 音声符号化レート選択器と音声符号化装置
US6034971A (en) * 1998-06-30 2000-03-07 Motorola, Inc. Method and apparatus for controlling communication system capacity
US6081776A (en) * 1998-07-13 2000-06-27 Lockheed Martin Corp. Speech coding system and method including adaptive finite impulse response filter
DE19833318C2 (de) * 1998-07-24 2001-08-02 Bosch Gmbh Robert Verfahren zur Übertragung von digitalen Nutzdaten
US6163766A (en) * 1998-08-14 2000-12-19 Motorola, Inc. Adaptive rate system and method for wireless communications
US6173254B1 (en) * 1998-08-18 2001-01-09 Denso Corporation, Ltd. Recorded message playback system for a variable bit rate system
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
US6330533B2 (en) 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US7117146B2 (en) * 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6449590B1 (en) 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6823303B1 (en) * 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6798736B1 (en) 1998-09-22 2004-09-28 Qualcomm Incorporated Method and apparatus for transmitting and receiving variable rate data
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6347297B1 (en) * 1998-10-05 2002-02-12 Legerity, Inc. Matrix quantization with vector quantization error compensation and neural network postprocessing for robust speech recognition
US6219642B1 (en) 1998-10-05 2001-04-17 Legerity, Inc. Quantization using frequency and mean compensated frequency input data for robust speech recognition
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
JP3343082B2 (ja) * 1998-10-27 2002-11-11 松下電器産業株式会社 Celp型音声符号化装置
US6754630B2 (en) 1998-11-13 2004-06-22 Qualcomm, Inc. Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation
US6463407B2 (en) 1998-11-13 2002-10-08 Qualcomm Inc. Low bit-rate coding of unvoiced segments of speech
US6233549B1 (en) 1998-11-23 2001-05-15 Qualcomm, Inc. Low frequency spectral enhancement system and method
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
US6289099B1 (en) * 1998-11-30 2001-09-11 Qualcomm Inc. Ringer for satellite user terminals
US6256606B1 (en) 1998-11-30 2001-07-03 Conexant Systems, Inc. Silence description coding for multi-rate speech codecs
US6275485B1 (en) * 1998-12-03 2001-08-14 Qualcomm Inc. Noise characterization in a wireless communication system
US6512925B1 (en) 1998-12-03 2003-01-28 Qualcomm, Incorporated Method and apparatus for controlling transmission power while in soft handoff
US6182030B1 (en) 1998-12-18 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Enhanced coding to improve coded communication signals
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6542486B1 (en) * 1998-12-22 2003-04-01 Nortel Networks Limited Multiple technology vocoder and an associated telecommunications network
US6393074B1 (en) 1998-12-31 2002-05-21 Texas Instruments Incorporated Decoding system for variable-rate convolutionally-coded data sequence
US7406098B2 (en) * 1999-01-13 2008-07-29 Qualcomm Incorporated Resource allocation in a communication system supporting application flows having quality of service requirements
KR100648872B1 (ko) * 1999-02-08 2006-11-24 퀄컴 인코포레이티드 가변 레이트 음성 코딩에 기초한 음성 합성기
US6411926B1 (en) 1999-02-08 2002-06-25 Qualcomm Incorporated Distributed voice recognition system
US6574596B2 (en) 1999-02-08 2003-06-03 Qualcomm Incorporated Voice recognition rejection scheme
US6330247B1 (en) 1999-02-08 2001-12-11 Qualcomm Incorporated Communication protocol between a communication device and an external accessory
US6324509B1 (en) 1999-02-08 2001-11-27 Qualcomm Incorporated Method and apparatus for accurate endpointing of speech in the presence of noise
US6226607B1 (en) * 1999-02-08 2001-05-01 Qualcomm Incorporated Method and apparatus for eighth-rate random number generation for speech coders
US6587446B2 (en) * 1999-02-11 2003-07-01 Qualcomm Incorporated Handoff in a wireless communication system
US6260009B1 (en) 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
US6449592B1 (en) 1999-02-26 2002-09-10 Qualcomm Incorporated Method and apparatus for tracking the phase of a quasi-periodic signal
US6397177B1 (en) * 1999-03-10 2002-05-28 Samsung Electronics, Co., Ltd. Speech-encoding rate decision apparatus and method in a variable rate
US6088347A (en) * 1999-03-10 2000-07-11 Massachusetts Institute Of Technology Variable chip rate code-division multiple access
US6233552B1 (en) * 1999-03-12 2001-05-15 Comsat Corporation Adaptive post-filtering technique based on the Modified Yule-Walker filter
US6519479B1 (en) 1999-03-31 2003-02-11 Qualcomm Inc. Spoken user interface for speech-enabled devices
US6747963B1 (en) * 1999-04-12 2004-06-08 Samsung Electronics Co., Ltd. Apparatus and method for gated transmission in a CDMA communication system
US7058573B1 (en) * 1999-04-20 2006-06-06 Nuance Communications Inc. Speech recognition system to selectively utilize different speech recognition techniques over multiple speech recognition passes
US6260017B1 (en) 1999-05-07 2001-07-10 Qualcomm Inc. Multipulse interpolative coding of transition speech frames
US6766295B1 (en) 1999-05-10 2004-07-20 Nuance Communications Adaptation of a speech recognition system across multiple remote sessions with a speaker
US6661832B1 (en) * 1999-05-11 2003-12-09 Qualcomm Incorporated System and method for providing an accurate estimation of received signal interference for use in wireless communications systems
US6954727B1 (en) * 1999-05-28 2005-10-11 Koninklijke Philips Electronics N.V. Reducing artifact generation in a vocoder
US6324503B1 (en) 1999-07-19 2001-11-27 Qualcomm Incorporated Method and apparatus for providing feedback from decoder to encoder to improve performance in a predictive speech coder under frame erasure conditions
US6393394B1 (en) 1999-07-19 2002-05-21 Qualcomm Incorporated Method and apparatus for interleaving line spectral information quantization methods in a speech coder
US6324505B1 (en) * 1999-07-19 2001-11-27 Qualcomm Incorporated Amplitude quantization scheme for low-bit-rate speech coders
US6330532B1 (en) 1999-07-19 2001-12-11 Qualcomm Incorporated Method and apparatus for maintaining a target bit rate in a speech coder
US6397175B1 (en) 1999-07-19 2002-05-28 Qualcomm Incorporated Method and apparatus for subsampling phase spectrum information
US6496706B1 (en) 1999-07-23 2002-12-17 Qualcomm Incorporated Method and system for transmit gating in a wireless communication system
US6704328B1 (en) * 1999-07-26 2004-03-09 Nortel Networks, Limited Signalling scheme and messaging structure to support the smoothing of large bit rate transmissions
US6603752B1 (en) * 1999-07-29 2003-08-05 Ahmed Saifuddin Method and system for controlling transmission energy in a variable rate gated communication system
US6658112B1 (en) 1999-08-06 2003-12-02 General Dynamics Decision Systems, Inc. Voice decoder and method for detecting channel errors using spectral energy evolution
US6633552B1 (en) * 1999-08-06 2003-10-14 Qualcomm Incorporated Method and apparatus for determining the closed loop power control set point in a wireless packet data communication system
US6597667B1 (en) 1999-08-18 2003-07-22 Qualcomm Incorporated Network based muting of a cellular telephone
US6493329B1 (en) * 1999-08-23 2002-12-10 Qualcomm Incorporated Adaptive channel estimation in a wireless communication system
US8064409B1 (en) 1999-08-25 2011-11-22 Qualcomm Incorporated Method and apparatus using a multi-carrier forward link in a wireless communication system
US6426971B1 (en) 1999-09-13 2002-07-30 Qualcomm Incorporated System and method for accurately predicting signal to interference and noise ratio to improve communications system performance
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6574593B1 (en) 1999-09-22 2003-06-03 Conexant Systems, Inc. Codebook tables for encoding and decoding
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
AU2003262451B2 (en) * 1999-09-22 2006-01-19 Macom Technology Solutions Holdings, Inc. Multimode speech encoder
US7054809B1 (en) * 1999-09-22 2006-05-30 Mindspeed Technologies, Inc. Rate selection method for selectable mode vocoder
AU766830B2 (en) * 1999-09-22 2003-10-23 Macom Technology Solutions Holdings, Inc. Multimode speech encoder
US6581032B1 (en) 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6959274B1 (en) 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6708024B1 (en) * 1999-09-22 2004-03-16 Legerity, Inc. Method and apparatus for generating comfort noise
US6772126B1 (en) * 1999-09-30 2004-08-03 Motorola, Inc. Method and apparatus for transferring low bit rate digital voice messages using incremental messages
US6496798B1 (en) * 1999-09-30 2002-12-17 Motorola, Inc. Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message
US6621804B1 (en) 1999-10-07 2003-09-16 Qualcomm Incorporated Method and apparatus for predicting favored supplemental channel transmission slots using transmission power measurements of a fundamental channel
US6850506B1 (en) 1999-10-07 2005-02-01 Qualcomm Incorporated Forward-link scheduling in a wireless communication system
US7522631B1 (en) 1999-10-26 2009-04-21 Qualcomm, Incorporated Method and apparatus for efficient data transmission control in a wireless voice-over-data communication system
US6463274B1 (en) * 1999-10-26 2002-10-08 Denso Corporation Multiple class of service determination for digital cellular telephones
US6438518B1 (en) 1999-10-28 2002-08-20 Qualcomm Incorporated Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions
US6496794B1 (en) * 1999-11-22 2002-12-17 Motorola, Inc. Method and apparatus for seamless multi-rate speech coding
BR0006803A (pt) * 1999-12-10 2001-12-11 Lucent Technologies Inc Sistema e método para reduzir retardo de fala emelhorar a qualidade de fala utilizando meiosblocos
US6772112B1 (en) 1999-12-10 2004-08-03 Lucent Technologies Inc. System and method to reduce speech delay and improve voice quality using half speech blocks
US7574351B2 (en) * 1999-12-14 2009-08-11 Texas Instruments Incorporated Arranging CELP information of one frame in a second packet
US6745024B1 (en) 2000-01-10 2004-06-01 Qualcomm Incorporated System and method for preparing and sending an electronic mail communication using a wireless communications device
US6510409B1 (en) * 2000-01-18 2003-01-21 Conexant Systems, Inc. Intelligent discontinuous transmission and comfort noise generation scheme for pulse code modulation speech coders
US7127390B1 (en) * 2000-02-08 2006-10-24 Mindspeed Technologies, Inc. Rate determination coding
EP1126651A1 (en) * 2000-02-16 2001-08-22 Lucent Technologies Inc. Link adaptation for RT-EGPRS
US6721368B1 (en) 2000-03-04 2004-04-13 Qualcomm Incorporated Transmitter architectures for communications systems
ES2318820T3 (es) 2000-04-24 2009-05-01 Qualcomm Incorporated Procedimiento y aparatos de cuantificacion predictiva del habla de voces.
US6584438B1 (en) 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
US6980527B1 (en) 2000-04-25 2005-12-27 Cwill Telecommunications, Inc. Smart antenna CDMA wireless communication system
US6285682B1 (en) * 2000-05-01 2001-09-04 Motorola, Inc. Method and apparatus for determining the frame rate of a frame
US7080009B2 (en) * 2000-05-01 2006-07-18 Motorola, Inc. Method and apparatus for reducing rate determination errors and their artifacts
FI115329B (fi) 2000-05-08 2005-04-15 Nokia Corp Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin
US7089181B2 (en) * 2001-05-30 2006-08-08 Intel Corporation Enhancing the intelligibility of received speech in a noisy environment
US7072833B2 (en) 2000-06-02 2006-07-04 Canon Kabushiki Kaisha Speech processing system
US6954745B2 (en) 2000-06-02 2005-10-11 Canon Kabushiki Kaisha Signal processing system
US7035790B2 (en) 2000-06-02 2006-04-25 Canon Kabushiki Kaisha Speech processing system
US7010483B2 (en) 2000-06-02 2006-03-07 Canon Kabushiki Kaisha Speech processing system
US6735563B1 (en) 2000-07-13 2004-05-11 Qualcomm, Inc. Method and apparatus for constructing voice templates for a speaker-independent voice recognition system
US6671669B1 (en) * 2000-07-18 2003-12-30 Qualcomm Incorporated combined engine system and method for voice recognition
US6510142B1 (en) 2000-07-21 2003-01-21 Motorola, Inc. Method and apparatus for reduced reversed traffic in a cellular telephone system
US6856954B1 (en) * 2000-07-28 2005-02-15 Mindspeed Technologies, Inc. Flexible variable rate vocoder for wireless communication systems
US6728669B1 (en) * 2000-08-07 2004-04-27 Lucent Technologies Inc. Relative pulse position in celp vocoding
EP1944760B1 (en) * 2000-08-09 2009-09-23 Sony Corporation Voice data processing device and processing method
US6477502B1 (en) 2000-08-22 2002-11-05 Qualcomm Incorporated Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system
US6850884B2 (en) * 2000-09-15 2005-02-01 Mindspeed Technologies, Inc. Selection of coding parameters based on spectral content of a speech signal
US6842733B1 (en) 2000-09-15 2005-01-11 Mindspeed Technologies, Inc. Signal processing system for filtering spectral content of a signal for speech coding
US6937979B2 (en) * 2000-09-15 2005-08-30 Mindspeed Technologies, Inc. Coding based on spectral content of a speech signal
US7133823B2 (en) * 2000-09-15 2006-11-07 Mindspeed Technologies, Inc. System for an adaptive excitation pattern for speech coding
US6802035B2 (en) * 2000-09-19 2004-10-05 Intel Corporation System and method of dynamically optimizing a transmission mode of wirelessly transmitted information
US6760882B1 (en) 2000-09-19 2004-07-06 Intel Corporation Mode selection for data transmission in wireless communication channels based on statistical parameters
US6973098B1 (en) 2000-10-25 2005-12-06 Qualcomm, Incorporated Method and apparatus for determining a data rate in a high rate packet data wireless communications system
US7068683B1 (en) 2000-10-25 2006-06-27 Qualcomm, Incorporated Method and apparatus for high rate packet data and low delay data transmissions
US7171355B1 (en) * 2000-10-25 2007-01-30 Broadcom Corporation Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
DK1206104T3 (da) * 2000-11-09 2006-10-30 Koninkl Kpn Nv Måling af en samtalekvalitet af en telefonforbindelse i et telekommunikationsnetværk
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
US6999430B2 (en) * 2000-11-30 2006-02-14 Qualcomm Incorporated Method and apparatus for transmitting data traffic on a wireless communication channel
US6804218B2 (en) 2000-12-04 2004-10-12 Qualcomm Incorporated Method and apparatus for improved detection of rate errors in variable rate receivers
US7472059B2 (en) * 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
US7505594B2 (en) * 2000-12-19 2009-03-17 Qualcomm Incorporated Discontinuous transmission (DTX) controller system and method
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US7346918B2 (en) 2000-12-27 2008-03-18 Z-Band, Inc. Intelligent device system and method for distribution of digital signals on a wideband signal distribution system
US7230978B2 (en) 2000-12-29 2007-06-12 Infineon Technologies Ag Channel CODEC processor configurable for multiple wireless communications standards
US7113522B2 (en) * 2001-01-24 2006-09-26 Qualcomm, Incorporated Enhanced conversion of wideband signals to narrowband signals
US7062445B2 (en) * 2001-01-26 2006-06-13 Microsoft Corporation Quantization loop with heuristic approach
US7120134B2 (en) * 2001-02-15 2006-10-10 Qualcomm, Incorporated Reverse link channel architecture for a wireless communication system
US20040204935A1 (en) * 2001-02-21 2004-10-14 Krishnasamy Anandakumar Adaptive voice playout in VOP
US6760587B2 (en) 2001-02-23 2004-07-06 Qualcomm Incorporated Forward-link scheduling in a wireless communication system during soft and softer handoff
US7289461B2 (en) 2001-03-15 2007-10-30 Qualcomm Incorporated Communications using wideband terminals
US20020181546A1 (en) * 2001-03-23 2002-12-05 Odenwalder Joseph P. Preamble channels
US6760576B2 (en) 2001-03-27 2004-07-06 Qualcomm Incorporated Method and apparatus for enhanced rate determination in high data rate wireless communication systems
US8199696B2 (en) * 2001-03-29 2012-06-12 Qualcomm Incorporated Method and apparatus for power control in a wireless communication system
US6625172B2 (en) 2001-04-26 2003-09-23 Joseph P. Odenwalder Rescheduling scheduled transmissions
US7230941B2 (en) * 2001-04-26 2007-06-12 Qualcomm Incorporated Preamble channel decoding
JP4591939B2 (ja) * 2001-05-15 2010-12-01 Kddi株式会社 適応的符号化伝送装置および受信装置
US6990137B2 (en) * 2001-05-17 2006-01-24 Qualcomm, Incorporated System and method for received signal prediction in wireless communications systems
US7170924B2 (en) * 2001-05-17 2007-01-30 Qualcomm, Inc. System and method for adjusting combiner weights using an adaptive algorithm in wireless communications system
JP3859462B2 (ja) * 2001-05-18 2006-12-20 株式会社東芝 予測パラメータ分析装置および予測パラメータ分析方法
US6789059B2 (en) 2001-06-06 2004-09-07 Qualcomm Incorporated Reducing memory requirements of a codebook vector search
GB2386809B (en) 2001-06-28 2004-06-02 Samsung Electronics Co Ltd Apparatus and method for decoding TFCI bits for a hard split mode in a CDMA mobile communication system
US7489655B2 (en) * 2001-07-06 2009-02-10 Qualcomm, Incorporated Method and apparatus for predictive scheduling in a bi-directional communication system
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
US7110942B2 (en) * 2001-08-14 2006-09-19 Broadcom Corporation Efficient excitation quantization in a noise feedback coding system using correlation techniques
US6885988B2 (en) * 2001-08-17 2005-04-26 Broadcom Corporation Bit error concealment methods for speech coding
US7162415B2 (en) * 2001-11-06 2007-01-09 The Regents Of The University Of California Ultra-narrow bandwidth voice coding
US7453801B2 (en) * 2001-11-08 2008-11-18 Qualcomm Incorporated Admission control and resource allocation in a communication system supporting application flows having quality of service requirements
CN101772091A (zh) * 2001-12-05 2010-07-07 高通股份有限公司 调整通信系统服务质量的系统与方法
US7027982B2 (en) * 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
US7146313B2 (en) * 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
GB2383239B (en) * 2001-12-15 2004-03-17 Motorola Inc A method and apparatus for transmitting data
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
JP3778087B2 (ja) * 2002-01-18 2006-05-24 富士ゼロックス株式会社 データ符号化装置及びデータ復号装置
US6957183B2 (en) * 2002-03-20 2005-10-18 Qualcomm Inc. Method for robust voice recognition by analyzing redundant features of source signal
US7313520B2 (en) * 2002-03-20 2007-12-25 The Directv Group, Inc. Adaptive variable bit rate audio compression encoding
US6980695B2 (en) * 2002-06-28 2005-12-27 Microsoft Corporation Rate allocation for mixed content video
US7321559B2 (en) * 2002-06-28 2008-01-22 Lucent Technologies Inc System and method of noise reduction in receiving wireless transmission of packetized audio signals
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US8090577B2 (en) 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
JP2004151123A (ja) * 2002-10-23 2004-05-27 Nec Corp 符号変換方法、符号変換装置、プログラム及びその記憶媒体
US7602722B2 (en) * 2002-12-04 2009-10-13 Nortel Networks Limited Mobile assisted fast scheduling for the reverse link
GB2396271B (en) * 2002-12-10 2005-08-10 Motorola Inc A user terminal and method for voice communication
US7698132B2 (en) * 2002-12-17 2010-04-13 Qualcomm Incorporated Sub-sampled excitation waveform codebooks
US7120447B1 (en) * 2003-02-24 2006-10-10 Nortel Networks Limited Selectable mode vocoder management algorithm for CDMA based networks
US6965859B2 (en) * 2003-02-28 2005-11-15 Xvd Corporation Method and apparatus for audio compression
KR100480341B1 (ko) * 2003-03-13 2005-03-31 한국전자통신연구원 광대역 저전송률 음성 신호의 부호화기
US7009999B2 (en) * 2003-03-28 2006-03-07 Qualcomm Incorporated Selective variable rate encoding to regulate data frame size
KR20050007977A (ko) * 2003-07-12 2005-01-21 삼성전자주식회사 이동 통신 시스템에서의 보코더의 모드 및 전송율 제어 방법
US7577756B2 (en) * 2003-07-15 2009-08-18 Special Devices, Inc. Dynamically-and continuously-variable rate, asynchronous data transfer
US7383180B2 (en) * 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques
US7609763B2 (en) * 2003-07-18 2009-10-27 Microsoft Corporation Advanced bi-directional predictive coding of video frames
US7343291B2 (en) * 2003-07-18 2008-03-11 Microsoft Corporation Multi-pass variable bitrate media encoding
US7146309B1 (en) 2003-09-02 2006-12-05 Mindspeed Technologies, Inc. Deriving seed values to generate excitation values in a speech coder
US7613606B2 (en) * 2003-10-02 2009-11-03 Nokia Corporation Speech codecs
US7379875B2 (en) * 2003-10-24 2008-05-27 Microsoft Corporation Systems and methods for generating audio thumbnails
US7505764B2 (en) * 2003-10-28 2009-03-17 Motorola, Inc. Method for retransmitting a speech packet
US20050147131A1 (en) * 2003-12-29 2005-07-07 Nokia Corporation Low-rate in-band data channel using CELP codewords
KR100629997B1 (ko) * 2004-02-26 2006-09-27 엘지전자 주식회사 오디오 신호의 인코딩 방법
US8473286B2 (en) * 2004-02-26 2013-06-25 Broadcom Corporation Noise feedback coding system and method for providing generalized noise shaping within a simple filter structure
ATE523876T1 (de) * 2004-03-05 2011-09-15 Panasonic Corp Fehlerverbergungseinrichtung und fehlerverbergungsverfahren
JP2005337573A (ja) 2004-05-26 2005-12-08 Sanden Corp 熱交換器
EP1768106B8 (en) * 2004-07-23 2017-07-19 III Holdings 12, LLC Audio encoding device and audio encoding method
US8046217B2 (en) * 2004-08-27 2011-10-25 Panasonic Corporation Geometric calculation of absolute phases for parametric stereo decoding
US7830900B2 (en) 2004-08-30 2010-11-09 Qualcomm Incorporated Method and apparatus for an adaptive de-jitter buffer
SE0402372D0 (sv) 2004-09-30 2004-09-30 Ericsson Telefon Ab L M Signal coding
SE528213C3 (sv) * 2004-09-30 2006-10-31 Ericsson Telefon Ab L M Förfaranden och arrangemang för adaptiva trösklar vid val av kodek
US8085678B2 (en) 2004-10-13 2011-12-27 Qualcomm Incorporated Media (voice) playback (de-jitter) buffer adjustments based on air interface
US7697480B2 (en) * 2004-11-22 2010-04-13 Motorola, Inc Method and apparatus for inter-system active handoff of a hybrid subscriber unit
US7983679B2 (en) * 2004-11-22 2011-07-19 Motorola Mobility, Inc. Method and apparatus for inter-system active handoff of a hybrid subscriber unit
US8102872B2 (en) * 2005-02-01 2012-01-24 Qualcomm Incorporated Method for discontinuous transmission and accurate reproduction of background noise information
US20060224381A1 (en) * 2005-04-04 2006-10-05 Nokia Corporation Detecting speech frames belonging to a low energy sequence
US20060241937A1 (en) * 2005-04-21 2006-10-26 Ma Changxue C Method and apparatus for automatically discriminating information bearing audio segments and background noise audio segments
US7983301B2 (en) * 2005-06-24 2011-07-19 O2Micro International, Ltd. Method for extended transmission capabilities of short message service
US20080201689A1 (en) * 2005-06-30 2008-08-21 Freescale Semiconductor, Inc. Vector Crc Computatuion on Dsp
US20070005347A1 (en) * 2005-06-30 2007-01-04 Kotzin Michael D Method and apparatus for data frame construction
JP5035816B2 (ja) * 2005-07-14 2012-09-26 一般財団法人電力中央研究所 細孔内付着液体残留量推定方法
US7542421B2 (en) * 2005-09-09 2009-06-02 Tropos Networks Adaptive control of transmission power and data rates of transmission links between access nodes of a mesh network
CN1964244B (zh) * 2005-11-08 2010-04-07 厦门致晟科技有限公司 一种用声码器收发数字信号的方法
US8145477B2 (en) * 2005-12-02 2012-03-27 Sharath Manjunath Systems, methods, and apparatus for computationally efficient, iterative alignment of speech waveforms
JP4971351B2 (ja) * 2005-12-05 2012-07-11 クゥアルコム・インコーポレイテッド トーンコンポーネントの検出のためのシステム、方法および装置
KR100744542B1 (ko) * 2005-12-08 2007-08-01 한국전자통신연구원 가변대역 멀티코덱 QoS 제어 장치 및 방법
US8090573B2 (en) * 2006-01-20 2012-01-03 Qualcomm Incorporated Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision
US8032369B2 (en) * 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US8346544B2 (en) * 2006-01-20 2013-01-01 Qualcomm Incorporated Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision
JP4816115B2 (ja) * 2006-02-08 2011-11-16 カシオ計算機株式会社 音声符号化装置及び音声符号化方法
US8036242B2 (en) * 2006-02-15 2011-10-11 Qualcomm Incorporated Dynamic capacity operating point management for a vocoder in an access terminal
US7720499B2 (en) * 2006-02-27 2010-05-18 Tropos Networks, Inc. Regulation of transmission power control in mitigate self interference by optimizing link transmission parameters in a wireless network
JP4771835B2 (ja) * 2006-03-06 2011-09-14 株式会社リコー トナー及び画像形成方法
FR2898443A1 (fr) * 2006-03-13 2007-09-14 France Telecom Procede de codage d'un signal audio source, dispositif de codage, procede et dispositif de decodage, signal, produits programme d'ordinateur correspondants
US7778828B2 (en) * 2006-03-15 2010-08-17 Sasken Communication Technologies Ltd. Method and system for automatic gain control of a speech signal
US8392176B2 (en) * 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
DE102006025042B4 (de) * 2006-05-26 2008-08-14 Infineon Technologies Ag Datenratenfehler-tolerante Synchronisation eines digitalen Empfängers
US8036186B2 (en) * 2006-07-26 2011-10-11 Tropos Networks, Inc. Adaptively setting transmission power levels of nodes within a wireless mesh network
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
KR100883652B1 (ko) * 2006-08-03 2009-02-18 삼성전자주식회사 음성 구간 검출 방법 및 장치, 및 이를 이용한 음성 인식시스템
ATE463028T1 (de) * 2006-09-13 2010-04-15 Ericsson Telefon Ab L M Verfahren und anordnungen für einen sprach- /audiosender und empfänger
US7877253B2 (en) 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
EP2074711A2 (en) 2006-10-06 2009-07-01 ViaSat, Inc. Forward and reverse calibration for ground-based beamforming
JP5096474B2 (ja) * 2006-10-10 2012-12-12 クゥアルコム・インコーポレイテッド オーディオ信号を符号化及び復号化する方法及び装置
KR100833499B1 (ko) * 2006-10-27 2008-05-29 한국전자통신연구원 가변 대역 멀티 코덱의 음성 품질 측정 장치 및 방법
CN100587186C (zh) * 2006-11-02 2010-02-03 邹家祥 一种保温组合墙板构筑墙体的方法
US8279889B2 (en) * 2007-01-04 2012-10-02 Qualcomm Incorporated Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate
US8254455B2 (en) * 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
US20090198500A1 (en) * 2007-08-24 2009-08-06 Qualcomm Incorporated Temporal masking in audio coding based on spectral dynamics in frequency sub-bands
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
US20090094026A1 (en) * 2007-10-03 2009-04-09 Binshi Cao Method of determining an estimated frame energy of a communication
US8326617B2 (en) * 2007-10-24 2012-12-04 Qnx Software Systems Limited Speech enhancement with minimum gating
US8606566B2 (en) * 2007-10-24 2013-12-10 Qnx Software Systems Limited Speech enhancement through partial speech reconstruction
US8015002B2 (en) 2007-10-24 2011-09-06 Qnx Software Systems Co. Dynamic noise reduction using linear model fitting
WO2009078093A1 (ja) 2007-12-18 2009-06-25 Fujitsu Limited 非音声区間検出方法及び非音声区間検出装置
JP5449133B2 (ja) * 2008-03-14 2014-03-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
US8325800B2 (en) 2008-05-07 2012-12-04 Microsoft Corporation Encoding streaming media as a high bit rate layer, a low bit rate layer, and one or more intermediate bit rate layers
US8379851B2 (en) 2008-05-12 2013-02-19 Microsoft Corporation Optimized client side rate control and indexed file layout for streaming media
US7925774B2 (en) * 2008-05-30 2011-04-12 Microsoft Corporation Media streaming using an index file
US7948887B2 (en) * 2008-06-24 2011-05-24 Microsoft Corporation Network bandwidth measurement
US8144602B2 (en) * 2008-08-06 2012-03-27 Jds Uniphase Corporation Network load tester with real-time detection and recording
US8265140B2 (en) 2008-09-30 2012-09-11 Microsoft Corporation Fine-grained client-side control of scalable media delivery
US8964692B2 (en) * 2008-11-10 2015-02-24 Qualcomm Incorporated Spectrum sensing of bluetooth using a sequence of energy detection measurements
EP2211335A1 (en) * 2009-01-21 2010-07-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal
US8189666B2 (en) 2009-02-02 2012-05-29 Microsoft Corporation Local picture identifier and computation of co-located information
WO2010140940A1 (en) * 2009-06-04 2010-12-09 Telefonaktiebolaget Lm Ericsson (Publ) A method and arrangement for estimating the quality degradation of a processed signal
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
CN102483926B (zh) 2009-07-27 2013-07-24 Scti控股公司 在处理语音信号中通过把语音作为目标和忽略噪声以降噪的系统及方法
US8811200B2 (en) 2009-09-22 2014-08-19 Qualcomm Incorporated Physical layer metrics to support adaptive station-dependent channel state information feedback rate in multi-user communication systems
WO2011049514A1 (en) 2009-10-19 2011-04-28 Telefonaktiebolaget Lm Ericsson (Publ) Method and background estimator for voice activity detection
US9020812B2 (en) * 2009-11-24 2015-04-28 Lg Electronics Inc. Audio signal processing method and device
US8781822B2 (en) * 2009-12-22 2014-07-15 Qualcomm Incorporated Audio and speech processing with optimal bit-allocation for constant bit rate applications
US20110196673A1 (en) * 2010-02-11 2011-08-11 Qualcomm Incorporated Concealing lost packets in a sub-band coding decoder
US8374858B2 (en) * 2010-03-09 2013-02-12 Dts, Inc. Scalable lossless audio codec and authoring tool
US9082416B2 (en) * 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
WO2012110448A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
MX2013009303A (es) 2011-02-14 2013-09-13 Fraunhofer Ges Forschung Codec de audio utilizando sintesis de ruido durante fases inactivas.
CA2827272C (en) 2011-02-14 2016-09-06 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
TR201903388T4 (tr) 2011-02-14 2019-04-22 Fraunhofer Ges Forschung Bir ses sinyalinin parçalarının darbe konumlarının şifrelenmesi ve çözülmesi.
AR085794A1 (es) 2011-02-14 2013-10-30 Fraunhofer Ges Forschung Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
SG192746A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for processing a decoded audio signal in a spectral domain
PL2661745T3 (pl) * 2011-02-14 2015-09-30 Fraunhofer Ges Forschung Urządzenie i sposób do ukrywania błędów w zunifikowanym kodowaniu mowy i audio
AU2012217158B2 (en) 2011-02-14 2014-02-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US8762136B2 (en) * 2011-05-03 2014-06-24 Lsi Corporation System and method of speech compression using an inter frame parameter correlation
US8990074B2 (en) 2011-05-24 2015-03-24 Qualcomm Incorporated Noise-robust speech coding mode classification
FR2977969A1 (fr) * 2011-07-12 2013-01-18 France Telecom Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee
US9208796B2 (en) * 2011-08-22 2015-12-08 Genband Us Llc Estimation of speech energy based on code excited linear prediction (CELP) parameters extracted from a partially-decoded CELP-encoded bit stream and applications of same
EP2798631B1 (en) * 2011-12-21 2016-03-23 Huawei Technologies Co., Ltd. Adaptively encoding pitch lag for voiced speech
US9111531B2 (en) * 2012-01-13 2015-08-18 Qualcomm Incorporated Multiple coding mode signal classification
CN108831501B (zh) 2012-03-21 2023-01-10 三星电子株式会社 用于带宽扩展的高频编码/高频解码方法和设备
RU2650025C2 (ru) 2012-12-21 2018-04-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Генерирование комфортного шума с высоким спектрально-временным разрешением при прерывистой передаче аудиосигналов
CA2895391C (en) * 2012-12-21 2019-08-06 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Comfort noise addition for modeling background noise at low bit-rates
ES2628127T3 (es) 2013-04-05 2017-08-01 Dolby International Ab Cuantificador avanzado
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
US9640185B2 (en) * 2013-12-12 2017-05-02 Motorola Solutions, Inc. Method and apparatus for enhancing the modulation index of speech sounds passed through a digital vocoder
US9570095B1 (en) * 2014-01-17 2017-02-14 Marvell International Ltd. Systems and methods for instantaneous noise estimation
US9721580B2 (en) * 2014-03-31 2017-08-01 Google Inc. Situation dependent transient suppression
CN105023579A (zh) * 2014-04-30 2015-11-04 中国电信股份有限公司 语音通信中语音编码实现方法、装置和通信终端
EP2980796A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
CN104833105A (zh) * 2015-05-28 2015-08-12 芜湖美的厨卫电器制造有限公司 热水器和热水器系统
US11631421B2 (en) * 2015-10-18 2023-04-18 Solos Technology Limited Apparatuses and methods for enhanced speech recognition in variable environments
WO2017118495A1 (en) * 2016-01-03 2017-07-13 Auro Technologies Nv A signal encoder, decoder and methods using predictor models
US11227214B2 (en) 2017-11-14 2022-01-18 Advanced Micro Devices, Inc. Memory bandwidth reduction techniques for low power convolutional neural network inference applications
EA038803B1 (ru) * 2017-12-25 2021-10-21 Федеральное государственное унитарное предприятие "Всероссийский научно-исследовательский институт автоматики им. Н.Л. Духова" Способ адаптивной цифровой фильтрации импульсных помех и фильтр для его реализации
US11948073B2 (en) 2018-04-20 2024-04-02 Advanced Micro Devices, Inc. Machine learning inference engine scalability
RU2691122C1 (ru) * 2018-06-13 2019-06-11 Ордена трудового Красного Знамени федеральное государственное бюджетное образовательное учреждение высшего образования "Московский технический университет связи и информатики" (МТУСИ) Способ и устройство компандирования звуковых вещательных сигналов
US11775799B2 (en) 2018-08-02 2023-10-03 Advanced Micro Devices, Inc. Runtime extension for neural network training with heterogeneous memory
US11769041B2 (en) 2018-10-31 2023-09-26 Advanced Micro Devices, Inc. Low latency long short-term memory inference with sequence interleaving
US11063645B2 (en) 2018-12-18 2021-07-13 XCOM Labs, Inc. Methods of wirelessly communicating with a group of devices
US10756795B2 (en) 2018-12-18 2020-08-25 XCOM Labs, Inc. User equipment with cellular link and peer-to-peer link
CN111338974A (zh) 2018-12-19 2020-06-26 超威半导体公司 用于矩阵数学指令集的图块化算法
CN111353575A (zh) * 2018-12-20 2020-06-30 超威半导体公司 用于卷积神经网络的图块化格式
US11330649B2 (en) 2019-01-25 2022-05-10 XCOM Labs, Inc. Methods and systems of multi-link peer-to-peer communications
US10756767B1 (en) 2019-02-05 2020-08-25 XCOM Labs, Inc. User equipment for wirelessly communicating cellular signal with another user equipment
US11610142B2 (en) 2019-05-28 2023-03-21 Ati Technologies Ulc Safety monitor for image misclassification
US11210199B2 (en) 2019-05-31 2021-12-28 Ati Technologies Ulc Safety monitor for invalid image transform
US11250867B1 (en) * 2019-10-08 2022-02-15 Rockwell Collins, Inc. Incorporating data into a voice signal with zero overhead
JP7332890B2 (ja) * 2019-11-19 2023-08-24 アイコム株式会社 音声通信システム、音声通信方法、および、音声通信プログラム
US11023390B1 (en) * 2020-03-27 2021-06-01 Arm Limited Resizing circuitry
CN112767953B (zh) * 2020-06-24 2024-01-23 腾讯科技(深圳)有限公司 语音编码方法、装置、计算机设备和存储介质

Family Cites Families (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US32580A (en) * 1861-06-18 Water-elevatok
US3633107A (en) * 1970-06-04 1972-01-04 Bell Telephone Labor Inc Adaptive signal processor for diversity radio receivers
JPS5017711A (ja) * 1973-06-15 1975-02-25
US3988674A (en) * 1975-03-17 1976-10-26 Communications Satellite Corporation (Comsat) Frame synchronization in speech predictive encoded communication system
US4076958A (en) * 1976-09-13 1978-02-28 E-Systems, Inc. Signal synthesizer spectrum contour scaler
US4214125A (en) * 1977-01-21 1980-07-22 Forrest S. Mozer Method and apparatus for speech synthesizing
CA1123955A (en) * 1978-03-30 1982-05-18 Tetsu Taguchi Speech analysis and synthesis apparatus
DE3023375C1 (ja) * 1980-06-23 1987-12-03 Siemens Ag, 1000 Berlin Und 8000 Muenchen, De
US4379949A (en) * 1981-08-10 1983-04-12 Motorola, Inc. Method of and means for variable-rate coding of LPC parameters
JPS6011360B2 (ja) * 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
DE3276651D1 (en) * 1982-11-26 1987-07-30 Ibm Speech signal coding method and apparatus
DE3370423D1 (en) * 1983-06-07 1987-04-23 Ibm Process for activity detection in a voice transmission system
US4672670A (en) * 1983-07-26 1987-06-09 Advanced Micro Devices, Inc. Apparatus and methods for coding, decoding, analyzing and synthesizing a signal
EP0163829B1 (en) * 1984-03-21 1989-08-23 Nippon Telegraph And Telephone Corporation Speech signal processing system
IT1179803B (it) * 1984-10-30 1987-09-16 Cselt Centro Studi Lab Telecom Metodo e dispositivo per la correzione di errori causati da rumore di tipo impulsivo su segnali vocali codificati con bassa velocita di ci fra e trasmessi su canali di comunicazione radio
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4937873A (en) * 1985-03-18 1990-06-26 Massachusetts Institute Of Technology Computationally efficient sine wave synthesis for acoustic waveform processing
US4856068A (en) * 1985-03-18 1989-08-08 Massachusetts Institute Of Technology Audio pre-processing methods and apparatus
US4831636A (en) * 1985-06-28 1989-05-16 Fujitsu Limited Coding transmission equipment for carrying out coding with adaptive quantization
US4827517A (en) * 1985-12-26 1989-05-02 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
US4797929A (en) * 1986-01-03 1989-01-10 Motorola, Inc. Word recognition in a speech recognition system using data reduced word templates
CA1299750C (en) * 1986-01-03 1992-04-28 Ira Alan Gerson Optimal method of data reduction in a speech recognition system
JPH0748695B2 (ja) * 1986-05-23 1995-05-24 株式会社日立製作所 音声符号化方式
US4899384A (en) * 1986-08-25 1990-02-06 Ibm Corporation Table controlled dynamic bit allocation in a variable rate sub-band speech coder
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
US4903301A (en) * 1987-02-27 1990-02-20 Hitachi, Ltd. Method and system for transmitting variable rate speech signal
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US5202953A (en) * 1987-04-08 1993-04-13 Nec Corporation Multi-pulse type coding system with correlation calculation by backward-filtering operation for multi-pulse searching
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
US4831624A (en) * 1987-06-04 1989-05-16 Motorola, Inc. Error detection method for sub-band coding
US4802171A (en) * 1987-06-04 1989-01-31 Motorola, Inc. Method for error correction in digitally encoded speech
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
DE3875040T2 (de) * 1987-09-02 1993-02-25 Moltech Invent Sa Keramik-/metall-verbundwerkstoff.
US4811404A (en) * 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
US4852179A (en) * 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
US4896361A (en) * 1988-01-07 1990-01-23 Motorola, Inc. Digital speech coder having improved vector excitation source
DE3883519T2 (de) * 1988-03-08 1994-03-17 Ibm Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten.
DE3871369D1 (de) * 1988-03-08 1992-06-25 Ibm Verfahren und einrichtung zur sprachkodierung mit niedriger datenrate.
US5023910A (en) * 1988-04-08 1991-06-11 At&T Bell Laboratories Vector quantization in a harmonic speech coding arrangement
US4864561A (en) * 1988-06-20 1989-09-05 American Telephone And Telegraph Company Technique for improved subjective performance in a communication system using attenuated noise-fill
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
CA1321645C (en) * 1988-09-28 1993-08-24 Akira Ichikawa Method and system for voice coding based on vector quantization
EP0364647B1 (en) * 1988-10-19 1995-02-22 International Business Machines Corporation Improvement to vector quantizing coder
NL8901032A (nl) * 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
JP3033060B2 (ja) * 1988-12-22 2000-04-17 国際電信電話株式会社 音声予測符号化・復号化方式
CA2005115C (en) * 1989-01-17 1997-04-22 Juin-Hwey Chen Low-delay code-excited linear predictive coder for speech or audio
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
DE68916944T2 (de) * 1989-04-11 1995-03-16 Ibm Verfahren zur schnellen Bestimmung der Grundfrequenz in Sprachcodierern mit langfristiger Prädiktion.
US5060269A (en) * 1989-05-18 1991-10-22 General Electric Company Hybrid switched multi-pulse/stochastic speech coding technique
US4975956A (en) * 1989-07-26 1990-12-04 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
GB2235354A (en) * 1989-08-16 1991-02-27 Philips Electronic Associated Speech coding/encoding using celp
US5091945A (en) * 1989-09-28 1992-02-25 At&T Bell Laboratories Source dependent channel coding with error protection
AU6174290A (en) * 1989-10-06 1991-04-28 Motorola, Inc. Error detection/correction scheme for vocoders
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
JPH03181232A (ja) * 1989-12-11 1991-08-07 Toshiba Corp 可変レート符号化方式
US5097507A (en) * 1989-12-22 1992-03-17 General Electric Company Fading bit error protection for digital cellular multi-pulse speech coder
CH680030A5 (ja) * 1990-03-22 1992-05-29 Ascom Zelcom Ag
JP3102015B2 (ja) * 1990-05-28 2000-10-23 日本電気株式会社 音声復号化方法
US5103459B1 (en) * 1990-06-25 1999-07-06 Qualcomm Inc System and method for generating signal waveforms in a cdma cellular telephone system
US5235671A (en) * 1990-10-15 1993-08-10 Gte Laboratories Incorporated Dynamic bit allocation subband excited transform coding method and apparatus
US5187745A (en) * 1991-06-27 1993-02-16 Motorola, Inc. Efficient codebook search for CELP vocoders
DE69233794D1 (de) * 1991-06-11 2010-09-23 Qualcomm Inc Vocoder mit veränderlicher Bitrate
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
US5566206A (en) * 1993-06-18 1996-10-15 Qualcomm Incorporated Method and apparatus for determining data rate of transmitted variable rate data in a communications receiver
US5537410A (en) * 1994-09-15 1996-07-16 Oki Telecom Subsequent frame variable data rate indication method

Also Published As

Publication number Publication date
ATE294441T1 (de) 2005-05-15
CA2102099C (en) 2006-04-04
CA2635914A1 (en) 1992-12-23
IL113987A (en) 1996-11-14
JP2005182075A (ja) 2005-07-07
FI20011509A (fi) 2001-07-10
CA2483322C (en) 2008-09-23
DK0588932T3 (da) 2002-03-11
DE69232202D1 (de) 2001-12-20
DK1126437T3 (da) 2004-11-08
JP3566669B2 (ja) 2004-09-15
JP2002202800A (ja) 2002-07-19
JP3964915B2 (ja) 2007-08-22
ATE477571T1 (de) 2010-08-15
SG70558A1 (en) 2000-02-22
CN1119796C (zh) 2003-08-27
JP2006079107A (ja) 2006-03-23
FI118702B (fi) 2008-02-15
FI20061122L (fi) 2006-12-15
CN1167309A (zh) 1997-12-10
IL113987A0 (en) 1995-10-31
AU711484B2 (en) 1999-10-14
HK1014796A1 (en) 1999-09-30
JP2006221186A (ja) 2006-08-24
FI935597A0 (fi) 1993-12-13
DE69233397D1 (de) 2004-09-09
EP1675100A2 (en) 2006-06-28
BR9206143A (pt) 1995-01-03
AU671952B2 (en) 1996-09-19
EP1107231B1 (en) 2005-04-27
ATE272883T1 (de) 2004-08-15
CN1071036A (zh) 1993-04-14
HK1064785A1 (en) 2005-02-04
CN1159639A (zh) 1997-09-17
ES2166355T3 (es) 2002-04-16
JP3751957B2 (ja) 2006-03-08
EP1998319A3 (en) 2008-12-17
EP1107231A2 (en) 2001-06-13
EP1162601A3 (en) 2002-07-03
EP1126437B1 (en) 2004-08-04
US5414796A (en) 1995-05-09
AU1482597A (en) 1997-05-15
ES2348319T3 (es) 2010-12-02
CA2102099A1 (en) 1992-12-12
EP1239456A1 (en) 2002-09-11
CA2483296A1 (en) 1992-12-23
CA2568984C (en) 2007-07-10
AU6089396A (en) 1996-10-03
EP1162601A2 (en) 2001-12-12
DE69233794D1 (de) 2010-09-23
CN1381956A (zh) 2002-11-27
FI20061121A (fi) 2006-12-15
EP1126437A2 (en) 2001-08-22
FI20011508A (fi) 2001-07-10
CN1220334C (zh) 2005-09-21
CA2568984A1 (en) 1992-12-23
CA2483324A1 (en) 1992-12-23
DE69232202T2 (de) 2002-07-25
JPH06511320A (ja) 1994-12-15
EP0588932B1 (en) 2001-11-14
DE69233502T2 (de) 2006-02-23
ZA924082B (en) 1993-02-26
ES2240252T3 (es) 2005-10-16
CN1909059A (zh) 2007-02-07
EP1763020A3 (en) 2010-09-29
NO934544L (no) 1993-12-10
CN1286086C (zh) 2006-11-22
EP1998319A2 (en) 2008-12-03
NO934544D0 (no) 1993-12-10
DE69233397T2 (de) 2005-08-11
JP2004004897A (ja) 2004-01-08
JP4191746B2 (ja) 2008-12-03
AU2186592A (en) 1993-01-12
WO1992022891A1 (en) 1992-12-23
FI935597A (fi) 1993-12-13
AU693374B2 (en) 1998-06-25
CN1398052A (zh) 2003-02-19
ES2225321T3 (es) 2005-03-16
NO319559B1 (no) 2005-08-29
EP1998319B1 (en) 2010-08-11
EP1126437A3 (en) 2001-12-12
MX9202808A (es) 1992-12-01
HUT70719A (en) 1995-10-30
IL113988A (en) 1996-11-14
EP0588932A1 (en) 1994-03-30
HK1127152A1 (en) 2009-09-18
IL113988A0 (en) 1995-10-31
EP1107231A3 (en) 2001-12-05
CA2483322A1 (en) 1992-12-23
DE69233502D1 (de) 2005-06-02
JP2002023796A (ja) 2002-01-25
JP3955600B2 (ja) 2007-08-08
CN1112673C (zh) 2003-06-25
CA2483296C (en) 2008-01-22
FI120425B (fi) 2009-10-15
US5778338A (en) 1998-07-07
EP1763020A2 (en) 2007-03-14
CN1091535C (zh) 2002-09-25
HU215861B (hu) 1999-03-29
CN1196271C (zh) 2005-04-06
IL102146A (en) 1996-03-31
IL113986A0 (en) 1995-10-31
CA2483324C (en) 2008-05-06
US5657420A (en) 1997-08-12
ATE208945T1 (de) 2001-11-15
CN1492395A (zh) 2004-04-28
RU2107951C1 (ru) 1998-03-27
IL113986A (en) 1996-11-14

Similar Documents

Publication Publication Date Title
JP3432822B2 (ja) 可変速度ボコーダ
AU685902B2 (en) Linear prediction coefficient generation during frame erasure or packet loss
JP2007525723A (ja) 音声通信のためのコンフォートノイズ生成の方法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090523

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100523

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100523

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110523

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120523

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130523

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130523

Year of fee payment: 10