JP2004004897A - エンコードまたはデコードの方法および装置 - Google Patents

エンコードまたはデコードの方法および装置 Download PDF

Info

Publication number
JP2004004897A
JP2004004897A JP2003172114A JP2003172114A JP2004004897A JP 2004004897 A JP2004004897 A JP 2004004897A JP 2003172114 A JP2003172114 A JP 2003172114A JP 2003172114 A JP2003172114 A JP 2003172114A JP 2004004897 A JP2004004897 A JP 2004004897A
Authority
JP
Japan
Prior art keywords
rate
frame
codebook
pitch
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003172114A
Other languages
English (en)
Other versions
JP3751957B2 (ja
Inventor
Paul E Jacobs
ポール・イー・ジェイコブス
William R Gardner
ウィリアム・アール・ガードナー
Chong U Lee
チョン・ユー・リー
Klein S Gilhousen
クライン・エス・ギルハウセン
S Katherine Lam
エス・キャサリン・ラム
Ming-Chang Tsai
ミン−チャン・ツァイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=24866989&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2004004897(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2004004897A publication Critical patent/JP2004004897A/ja
Application granted granted Critical
Publication of JP3751957B2 publication Critical patent/JP3751957B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0057Block codes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/16Time-division multiplex systems in which the time allocation to individual channels within a transmission cycle is variable, e.g. to accommodate varying complexity of signals, to vary number of channels transmitted
    • H04J3/1682Allocation of channels according to the instantaneous demands of the users, e.g. concentrated multiplexers, statistical multiplexers
    • H04J3/1688Allocation of channels according to the instantaneous demands of the users, e.g. concentrated multiplexers, statistical multiplexers the demands of the users being taken into account after redundancy removal, e.g. by predictive coding, by variable sampling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0014Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the source coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0015Systems modifying transmission characteristics according to link quality, e.g. power backoff characterised by the adaptation strategy
    • H04L1/0017Systems modifying transmission characteristics according to link quality, e.g. power backoff characterised by the adaptation strategy where the mode-switching is based on Quality of Service requirement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0041Arrangements at the transmitter end
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0045Arrangements at the receiver end
    • H04L1/0046Code rate detection or code type detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Amplifiers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Solid-Sorbent Or Filter-Aiding Compositions (AREA)
  • Developing Agents For Electrophotography (AREA)
  • Oscillators With Electromechanical Resonators (AREA)
  • Curing Cements, Concrete, And Artificial Stone (AREA)
  • Dc Digital Transmission (AREA)
  • Luminescent Compositions (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Endoscopes (AREA)
  • Magnetic Record Carriers (AREA)
  • Table Devices Or Equipment (AREA)
  • Inorganic Insulating Materials (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Noise Elimination (AREA)

Abstract

【目的】可変速度ボコード化技術を使用してスピーチを圧縮する新しい改良された方法およびシステムを提供すること。
【構成】デジタル化されたスピーチサンプル(10)のフレームの可変速度コード化によってスピーチ信号圧縮を実行する装置および方法。デジタル化されたスピーチサンプルの各フレームに対するスピーチ活動のレベルが決定され、フレームスピーチ活動の決定されたレベルに基づく1組の速度から出力データパケット速度が選択される。速度の組の最低速度はスピーチ中の背景雑音または休止等の検出された最小レベルのスピーチ活動に対応し、一方最高速度は活動的な発声等の検出された最大レベルのスピーチ活動に対応する。その後、各フレームは選択された速度に対して予め定められたコード化フォーマットにしたがってコード化され、それにおいて各速度はコード化されたフレームを表す対応した数のビットを有する。データパケットは、選択された速度に対応したビット速度の各出力データパケットを持つ各コード化フレームに与えられる。
【選択図】  図10

Description

【0001】
【産業上の技術分野】
本発明は、スピーチ処理に関する。特に、本発明は圧縮の量がダイナミックに変化し、一方において再構成されたスピーチの品質に最小の影響を与えるスピーチを圧縮する新しい改良された方法およびシステムに関する。さらに、圧縮されたスピーチデータはエラーを導入する可能性があるチャンネル上を伝送されるように意図されているため、本発明の方法およびシステムはまた音声品質に対するチャンネルエラーの影響を最小にする。
【0002】
【従来の技術】
デジタル技術による音声の伝送は、特に長距離のデジタル無線電話の適用で広く普及してきている。したがって、予測される再構成スピーチの品質を維持するチャンネル上を伝送されることができる情報の最少量を決定することが重要である。スピーチがサンプルし、デジタル化するだけで伝送される場合、通常のアナログ電話のスピーチ品質を達成するために64キロビット/秒(kbps)程度のデータ速度が要求される。しかしながら、適切なコード化、伝送および受信機における再合成によって後続されるスピーチ解析の使用により、データ速度の著しい減少が実現可能である。
【0003】
人間のスピーチ発生のモデルに関連したパラメータを抽出することによって発声されたスピーチを圧縮する技術を使用した装置は、典型的にボコーダと呼ばれている。このような装置は、適切なパラメータを抽出するために入来したスピーチを解析するエンコーダおよびをそれが伝送チャンネル上で受信したパラメータを使用してスピーチを再合成するデコーダから構成されている。正確であるためには、モデルが一定に変化していなければならない。したがって、スピーチはパラメータが計算される時間のブロック、すなわち解析フレームに分割される。その後、パラメータは新しい各フレームに対して更新される。
【0004】
種々のクラスのスピーチコーダのうち、コード励起直線予測コード化(CELP)、ストカスティック(Stochastic)コード化またはベクトル励起スピーチコード化が1つのクラスである。この特定のクラスのコード化アルゴリズムの一例はトーマスE.トレメイン氏他による文献(“A 4.8kbps Code Excited linear Predictive Coder”,Proceedings of the Mobile Satellite Conference,1988年)に記載されている。
【0005】
ボコーダの機能は、スピーチに固有の本来の冗長性を全て除去することによって低いビット速度の信号にデジタル化されたスピーチ信号を圧縮することである。スピーチは典型的に主に音声域のフィルタ処理動作による短い期間の冗長性および音声コードによる音声域の励起のための長い期間の冗長性を有している。CELPコーダにおいて、これらの動作は短期間フォーマットのフィルタおよび長期間ピッチのフィルタの2つのフィルタによってモデル化される。これらの冗長性が除去されると、結果的な残留信号は、エンコードされなければならない白色ガウス雑音としてモデル化されることができる。この技術のベースは、人間の音声域のモデルを使用してスピーチ波形の短期間の予測を実行するLPCフィルタと呼ばれるフィルタのパラメータを計算することである。さらに、スピーチのピッチに関連した長期間の効果は、人間の音声和音を本質的にモデル化するピッチフィルタのパラメータを計算することによってモデル化される。最後に、これらのフィルタは励起されなければならず、これは波形が上記の2つのフィルタを励起したときに、結果として元のスピーチに最も近いコードブック中の多数のランダム励起波形の1つを決定することによって実行される。このように伝送パラメータは(1)LPCフィルタ、(2)ピッチフィルタおよび(3)コードブック励起の3つの項目に関連している。
【0006】
ボコーダ技術の使用はさらにチャンネル上を伝送される情報量を減少し、一方において再構成されたスピーチの品質を維持しようとすることを目的とするが、さらに減少するために別の技術が使用される必要がある。伝送される情報量を減少するために前に使用された1つの技術は音声活動のゲート化である。この技術において、スピーチの休止(pause)中に伝送される情報はない。この技術はデータ減少の所望の結果を達成するが、いくつかの欠点がある。
【0007】
多くの場合において、スピーチの品質はワードの最初の部分のクリッピングにより低下される。非活動中のチャンネルをオフにゲート制御することに関する別の問題は、システム利用者が通常スピーチに付随する背景雑音の欠如を知覚し、通常の電話機の呼びより低くチャンネルの品質を評価することである。活動ゲート制御に関する別の問題は、スピーチが生じないときに背景中の時々の突発的な雑音が送信機をトリガーし、結果的に受信機における雑音のバーストを除去することである。
【0008】
音声活動ゲートシステム中で合成されたスピーチの品質を改良しようとする試みにおいて、合成された快適な雑音はデコード化プロセス中に付加される。品質のある改良は快適な雑音を付加することによって達成されるが、それは快適な雑音がエンコーダの実際の背景雑音をモデル化しないため全体的な品質を実質的に改良しない。
【0009】
伝送される必要がある情報を結果的に減少するようにデータ圧縮を実現するさらに好ましい技術は、可変速度ボコード処理を行うことである。スピーチは沈黙期間すなわち休止の期間を本質的に含んでいるため、これらの期間を表すために要求されるデータ量は減少されることかできる。可変速度ボコーダは、これらの沈黙期間に対するデータ速度を減少することによってこの事実を非常に効果的に利用する。沈黙期間に対するデータ伝送中の完全な停止と対照的に、データ速度の減少は音声活動ゲート制御に関連した問題を克服し、一方において伝送された情報の減少を促進する。
【0010】
したがって、本発明の目的は可変速度ボコード化技術を使用してスピーチを圧縮する新しい改良された方法およびシステムを提供することである。
【0011】
【課題を解決するための手段】
本発明は、前に述べられたスピーチコーダのクラス、コード励起直線予測コード化(CELP)、ストカスティックコード化またはベクトル励起スピーチコード化のボコーダアルゴリズムを実行する。CELP技術自身は、再合成時に高品質のスピーチを結果的に生じさせるようにスピーチを表すために必要なデータの量を著しく減少する。上記のように、ボコーダパラメータは各フレームに対して更新される。本発明のボコーダは、モデルパラメータの周波数および正確さを変化することによって可変出力データ速度を提供する。
【0012】
本発明は、スピーチ活動に基づいて可変出力データ速度を生成することによって基本的なCELP技術と最も顕著に異なっている。構造は、パラメータがスピーチの休止中に少数回または低い正確さで更新されるように定められる。この技術は、伝送される情報の量をかなり大幅に減少することを可能にする。データ速度を減少するために使用される現象は、所定の話し手が会話中に実際に話している時間の平均パーセンテージである音声活動係数である。典型的な2方向電話会話に対して、平均データ速度は2以上の係数だけ減少される。スピーチの休止中、背景雑音だけがボコーダによってコード化される。これらの期間において、人間の音声域モデルに関連したパラメータのいくつかは伝送される必要がない。
【0013】
上記のように、沈黙中に伝送される情報の量を制限する従来の方法は音声活動ゲートと呼ばれ、沈黙の瞬間に伝送される情報がない技術である。受信側において、期間は合成された“快適な雑音”で満たされる。対照的に、可変速度ボコーダは好ましい実施例においてほぼ 8kbps乃至 1kbpsの範囲の速度でデータを連続的に伝送する。データの連続伝送を行うボコーダは、合成された“快適な雑音”を不要にし、背景雑音のコード化は再合成されたスピーチにさらに自然な性質を与える。したがって、本発明はスピーチと背景との間の滑らかな転移を可能にすることによって音声活動ゲートのものに対して再合成スピーチ品質を著しく改良する。
【0014】
本発明はさらにエラーの発生をマスクする新しい技術を含む。データは例えば雑音の多い無線リンクであるチャンネル上を伝送されるため、それはデータ中のエラーを適合しなければならない。生じるエラー数を減少するためにチャンネルコード化を使用する従来の技術は、成功的にエラーを減少することができる。しかしながら、チャンネルコード化だけでは再構成されたスピーチの高品質を確保するのに必要なエラー保護のレベルに完全に達しない。ボコード処理が連続的に発生する可変速度ボコーダにおいて、エラーはワードまたは音節の開始等の重要なスピーチ事象に関連したデータを破壊する。ボコーダに基づいた直線予測コード化(LPC)に関する典型的な問題は、音声域モデルに関連したパラメータ中のエラーが曖昧に人間の声のようであり、聞き手を困惑させるのに十分に元のワードの音を変化させる音を生じさせることである。本発明において、聞き手に対する知覚可能性を減少するようにエラーがマスクされる。したがって、本発明において実行されるエラーマスキングはスピーチの明瞭さに対するエラーの影響を著しく減少させる。
【0015】
任意のパラメータが変化する可能な最大量は低速で小さい範囲に制限されているため、これらの速度で伝送されるパラメータ中のエラーはスピーチ品質にほとんど影響を与えない。異なる速度のエラーはスピーチ品質に対して異なる知覚的影響を与えるため、伝送システムは高速データをさらに保護するように最適化されることができる。したがって、本発明は付加的な特徴としてチャンネルエラーに対する強さを提供する。
【0016】
CELPアルゴリズムの可変速度出力変形を行う時の本発明は、結果的に音声活動に応じて 8:1から64:1にダイナミックに変化するスピーチ圧縮を実行させる。述べられた圧縮係数はμ法則入力を参照して引用され、圧縮係数は直線入力に対して2の係数だけ高い。速度決定は、音声活動係数を完全に利用するようにフレーム単位ベースで行われる。スピーチ中の休止に対して生成されるデータが少なくても、再合成された背景雑音の知覚される劣化は最小にされる。本発明の技術を使用すると、近い呼びの品質のスピーチが通常の会話において 8kbpsの最大データ速度および 3.5kbps程度の平均データ速度で達成されることができる。
【0017】
本発明はスピーチ中の短い休止が検出されることを可能にするため、実効音声活動係数の減少が実現される。速度決定はハングオーバーなしにフレーム単位ベースで実行されることが可能であり、好ましい実施例においてデータ速度は典型的に20m秒のフレーム期間と同じ短さのスピーチ中の休止に対して低下される。したがって、音節間にあるような休止が捕捉される。この技術は、語句の間の長期間の休止だけでなく、短い休止もまた低速でエンコードされることができるため従来考えられるもの以上に音声活動係数を減少する。
【0018】
速度決定はフレームベースで行われるため、音声活動ゲートシステムのようにワードの開始部分のクリッピングは存在しない。この特性のクリッピングは、スピーチの検出とデータの伝送の再スタートとの間の遅延のために音声活動ゲート化システムにおいて発生する。各フレームに基づいた速度決定の使用は、結果的に全ての転移が自然の音を有するスピーチを生じさせる。
【0019】
常に伝送しているボコーダにより、話し手の周囲の背景雑音は連続的に受信端で聞取られ、それによってスピーチ休止中さらに自然な音を生成する。したがって、本発明は背景雑音に滑らかな転移を与える。聞き手がスピーチ中の背景雑音において聞取るものは、音声活動ゲートシステムのように休止中に合成された快適な雑音に突然変化しない。
【0020】
背景雑音は伝送のために連続的にボコード化されるため、背景の重要な事象は完全に明瞭に送られることができる。ある場合には、重要な背景雑音は最高の速度でコード化されてもよい。最大速度のコード化は、例えば大声で話している者が背景にいる場合、または街路にいる利用者の側を救急車が通過した場合に発生する。しかしながら、一定な、または遅く変化する背景雑音は低速でエンコードされる。
【0021】
可変速度ボコード化の使用は、デジタルセル電話機システムに基づいたコード分割多重アクセス(CDMA)の能力を2以上の係数だけ高めることを約束する。CDMAによりチャンネル間の干渉は任意のチャンネル上のデータ伝送の速度が減少すると自動的に低下するため、CDMAおよび可変速度ボコードが特に整合される。対照的に、TDMAまたはFDMAのような伝送スロットが割当てられるシステムを考慮すると、このようなシステムがデータ伝送速度の低下を利用するために、別の利用者に未使用のスロットの再割当てを調整するために外部的な介入が要求される。このような方式に固有の遅延はチャンネルが長いスピーチ休止中だけ再度割当てられることを示唆している。したがって、十分な利点が音声活動係数から得られることができない。しかしながら、外部調整により、可変速度ボコードは示された別の理由からCDMA以外のシステムで有効である。
【0022】
CDMAシステムにおいて、スピーチ品質は余分のシステム容量が所望された時に少し劣化される可能性がある。概略的に述べると、ボコーダは異なる結果的なスピーチ品質で異なる速度で全て動作する多数のボコーダと考えられる。したがって、スピーチ品質はデータ伝送の平均速度をさらに減少するために混合されることがてきる。最初の実験は、全速度および半分の速度のボコード処理されたスピーチを混合することによって例えば最大の許容可能なデータ速度が 8kbpsと 4kbpsとの間でフレーム単位ベースで変化され、結果的にスピーチは最大 4kbpsの半分の速度の変数より良好であるが、最大 8kbpsの全速度変数ほど良くない品質を有することを示している。
【0023】
大部分の電話機会話において、1人の人間だけが一時に話すことが良く知られている。完全な二重電話リンク用の付加的な機能として、速度インターロックが設けられてもよい。リンクの1方向が最高の伝送速度で送信している場合、リンクの他の方向の送信は強制的に最低速度にされる。リンクの2つ方向間のインターロックは、リンクの各方向の50%以下の平均使用を保証することができる。しかしながら、活動ゲート化時の速度インターロックの場合のように、チャンネルがゲート制御でオフされる場合、聞き手が話し手を遮って会話における話し手の役割を引継ぐ方法はない。本発明は、ボコード速度を設定する制御信号によって速度インターロックの能力を容易に提供する。
【0024】
最後に、可変速度ボコード方式を使用することによって、信号情報はスピーチ品質に対する非常に小さい影響を与えるだけでスピーチデータとチャンネルを共有することができることに留意しなければならない。例えば、高速フレームは低速音声データを送る半分および信号伝送データ用の別の半分との2つの部分に分割される。好ましい実施例のボコーダにおいて、全速度および半分の速度のボコードされたスピーチ間のスピーチ品質における小さい劣化だけが実現される。したがって、別のデータと共有された伝送用の低速でのスピーチのボコードは結果的に利用者に対してほとんど知覚不可能な差を生じるだけである。
【0025】
【実施例】
本発明によると、スピーチおよび、または背景雑音のような音は、良く知られた技術を使用してサンプルされ、デジタル化される。例えば、アナログ信号はμ法則/均一コード変換によって後続される標準方式の 8ビット/μ法則フォーマットによってデジタルフォーマットに変換される。その代わりとして、アナログ信号は均一なパルスコード変調(PCM)フォーマットでデジタル形態に直接変換されてもよい。したがって、好ましい実施例における各サンプルはデータの1つの16ビットワードによって表される。サンプルは、各フレームが予め定められた数のサンプルから成る入力データのフレームに構成される。ここに示された実施例において、 8kHzのサンプリング速度が考慮される。各フレームは、 8kHzのサンプル速度で 160個のサンプルまたは20m秒のスピーチから成る。別のサンプリング速度およびフレーム寸法が使用されてもよいことが理解されなければならない。
【0026】
ボコードの分野はスピーチコード化用の多数の異なる技術を含み、そのうちの1つはCELPコード化技術である。CELPコード化技術の要約は、上記の文献(“A 4.8kbps Code Excited Linear Oredictive Coder”)に記載されている。本発明は、一定数のサンプルでLPC解析が実行され、ピッチおよびコードブック探索が伝送速度に応じて変化している数のサンプルで実行されるコード化されたスピーチデータにおける可変速度を提供するようにCELPコード化技術の形態を実行する。概念において、本発明に適用されるCELPコード化は図10および図12を参照して論じられる。
【0027】
本発明の好ましい実施例において、スピーチ解析フレームは長さが20m秒であり、抽出されたパラメータは1秒当たり50回のバーストで伝送されることを意味する。さらに、データ伝送速度はほぼ 8kbpsから 4kbps、 2kbpsおよび 1kbpsに変化される。全速度(速度1と示す)で、データ伝送は8.55kbpsの速度であり、パラメータは11ビットの内部CRC(サイクル冗長検査)を含む 171ビットを使用する各フレームに対してエンコードされる。CRCビットがない場合、速度は 8kbpsである。半分の速度(速度1/2と示す)において、データ伝送は 4kbpsの速度であり、パラメータは80ビットを使用する各フレームに対してエンコードされる。1/4速度(速度1/4と示す)において、データ伝送は 2kbpsであり、パラメータは40ビットを使用する各フレームに対してエンコードされる。1/8速度(速度1/8と示す)において、データ伝送は 1kbpsであり、パラメータは16ビットを使用する各フレームに対してエンコードされる。
【0028】
図1は、スピーチデータ10の一例の解析フレームおよびLPC解析で使用されるハミングウインドウ12の関係をグラフで示す。異なる速度に対するLPC解析フレームおよびピッチおよびコードブックサブフレームは図6乃至図9においてグラフで示されている。全ての速度に対するLPC解析フレームは、同じ大きさであることを理解しなければならない。
【0029】
図面を参照すると、特に図1において、LPC解析はハミングウインドウ12を使用してウインドウ化されるフレーム10の 160個のスピーチデータサンプルを使用して行われる。図1に示されているように、サンプルs(n)は各フレーム内において 0乃至159の番号を付けられる。ハミングウインドウ12は、それが60個のサンプルによってフレーム10内においてオフセットされるように位置される。したがって、ハミングウインドウ12は現在のデータフレム10の60番目のサンプル、s(59)でスタートして連続し、後続するデータフレーム14の59番目のサンプル、s(58)を含む。したがって、現在のフレームであるフレーム10に対して生成された加重されたデータはまた次のフレームであるフレーム14からのデータに基づいたデータを含む。
【0030】
データ伝送速度に応じて、図2乃至図5に示されているようなデータフレーム10の異なるサブフレーム上で多数回ピッチフィルタおよびコードブック励起パラメータを計算するために探索が実行される。好ましい実施例において、以下説明されるようにピッチおよびコードブック探索が選択された速度に対応した種々の寸法のサブフレームにおいて実行されるように、1つの速度だけがフレーム10に対して選択されることが理解されなければならない。しかしながら、説明のために、フレーム10の好ましい実施例の種々の許容された速度に対するピッチおよびコードブックのサブフレーム構造探索は、図2乃至図5に示されている。
【0031】
全ての速度において、図1に示されているように1フレーム10当り1つのLPC計算が存在する。図2に示されているように、全速度において各ピッチサブフレーム16に対して2つのコードブックサブフレーム18が存在している。全速度において4つの各ピッチサブフレーム16に対して1つづつであり、それぞれ40個のサンプル長( 5m秒)の4つのピッチ更新が存在する。さらに、全速度において8つの各ピッチサブフレーム16に対して1つづつであり、それぞれ20個のサンプル長( 2.5m秒)の8つのコードブック更新が存在している。
【0032】
1/2速度において、図3に示されているように各ピッチサブフレーム20に対して2つのコードブックサブフレーム22が存在する。ピッチは2つの各ピッチフレーム20のそれぞれに対して1度づつ2度更新され、一方コードブックは4つの各コードブックサブフレーム22に対して1度づつ4度更新される。1/4の速度において、図4に示されているように、単一のピッチサブフレーム24に対して2つのコードブックサブフレーム26が存在する。ピッチはピッチサブフレーム24に対して1度更新され、一方コードブックは2つの各コードブックサブフレーム26に対して1度づつ2度更新される。図5に示されているように、1/8の速度においてピッチは決定されず、コードブックはフレーム10に対応したフレーム28において一度だけ更新される。
【0033】
さらに、LPC係数は1フレーム当り1度だけ計算されるが、それらは各サブフレーム上に中心を持つハミングウインドウによりLPC解析の結果を近似するように前のフレームからの結果的なLSP周波数を使用して4度までラインスペクトル対(LSP)表示を使用して直線的に補間される。例外は、全速度においてLPC係数がコードブックサブフレームに対して補間されないことである。さらに、LSP周波数計算に関する詳細を以下説明する。
【0034】
ピッチおよびコードブック探索を少ない頻度で実行することに加えて、少ないビットはまたLPC係数の伝送に割当てられる。種々の速度で割当てられたビットの数は図6乃至図9に示されている。図6乃至図9はそれぞれスピーチの各 160のサンプルフレームに割当てられるボコーダエンコードされたデータビットを表す。図6乃至図9において、各LPCブロック30a乃至30dの数は、短期間LPC係数をエンコードするために対応した速度で使用されるビットの数である。好ましい実施例において、全速度、1/2速度、1/4速度および1/8速度においてLPC係数をエンコードするために使用されたビットの数はそれぞれ40、20、10および10である。
【0035】
可変速度コード化を実行するために、LPCは最初にラインスペクトル対(LSP)に変換され、結果的なLSP周波数はDPCMコーダを使用して個々にエンコードされる。LPCのオーダは10であるため、10個のLSP周波数および10個の独立したDPCMコーダが存在する。DPCMコーダに対するビット割当ては表Iに示されている。
【表1】
Figure 2004004897
【0036】
エンコーダおよびデコーダの両方において、LSP周波数はピッチおよびコードブック探索における使用の前にLPCフィルタ係数に変換される。
【0037】
ピッチ探索に関して、図6に示されているような全速度において、ピッチ更新は各1/4のスピーチフレームに対して1度づつ4度計算される。全速度での各ピッチ更新に対して、10ビットは新しいピッチパラメータをエンコードするために使用される。ピッチ更新は図7乃至図9に示されているように別の速度に対して変化する回数で実行される。速度が減少すると、ピッチ更新の数もまた減少する。図7は、スピーチフレームの各半分に対して1度づつ2度計算される1/2速度に対するピッチ更新を示す。同様に、図8は全ての各スピーチフレームで一度計算される1/4速度に対するピッチ更新を示す。全速度に対するように、10ビットは1/2および1/4速度の各ピッチ更新に対して新しいピッチパラメータをエンコードするために使用される。しかしながら、図9に示されているように1/8速度に対して、この速度は少数のスピーチしかないか、或はスピーチが存在せず、ピッチ冗長性が存在しないときにフレームをエンコードするために使用されるため、ピッチ更新は計算されない。
【0038】
各10ビットのピッチ更新に対して、7ビットはピッチ遅延を表し、3ビットはピッチ利得を表す。ピッチ遅延は17と143との間であるように限定される。ピッチ利得は、3ビット値による表示のために0と2の間に直線的に量子化される。
【0039】
コードブック探索に関して、図6に示されたように全速度において、コードブック更新はスピーチフレームの各1/8に対して1度づつ8度計算される。全速度における各コードブック更新に対して、10ビットは新しいコードブックパラメータをエンコードするために使用される。コードブック更新は、図7乃至図9に示されているように他の速度において変化する回数行われる。しかしながら、速度が減少すると、コードブック更新の数も減少する。図7は、スピーチフレームの各1/4に対して1度づつ4度計算される1/2速度に対するコードブック更新を示す。図8は、スピーチフレームの各1/2に対して1度づつ2度計算される1/4に対するコードブック更新を示す。全速度に対するように、10ビットは1/2および1/4速度の各ピッチ更新に対して新しいコードブックパラメータをエンコードするために使用される。最後に、図9は全ての各スピーチフレームに対して1度計算される1/8速度に対するコードブック更新を示す。1/8速度で2ビットがコードブック利得を表し、他の4ビットがランダムビットである6ビットが伝送されることに留意しなければならない。以下、コードブック更新用のビット割当てに関してさらに詳細に説明する。
【0040】
データビットを表すコードブック更新のために割当てられるビットは、ピッチ予測残留物をベクトル量子化することを必要とした。全速度、1/2および1/4速度に対して、各コードフック更新は、10ビット全体に対してコードブックインデクスの7ビットプラスコードブック利得の3ビットからなる。コードブック利得は、対数ドメインで動作する微分パルスコード変調(DPCM)コーダを使用してエンコードされる。類似したビット構造が1/8速度に対して使用されることができるが、別の方式が好ましい。1/8速度に対して、コードブック利得は2ビットによって表され、一方ランダムに発生された4ビットはコードブックと置換する疑似ランダム数発生器に対するシードとして受信されたデータと共に使用される。
【0041】
図10に示されたエンコーダのブロック図を参照すると、開ループモードでLPC解析が行われる。入力スピーチサンプルs(n)の各フレームから、係数(α乃至α10)は、以下説明されるようにフォルマント合成フィルタ60における使用のためにLPC解析/量子化装置50によって計算される。
【0042】
しかしながら、ピッチ探索の計算は解析合成方法と呼ばれる閉ループモードで行われる。しかしながら、構成において新しいハイブリッド閉ループ/開ループ技術がピッチ探索を行うために使用される。ピッチ探索において、エンコード処理は入力スピーチと合成スピーチとの間の2乗平均エラーを最小にするパラメータを選択することによって実行される。簡明化のために、この説明部分において速度の問題は考慮しない。しかしながら、ピッチおよびコードブック探索における選択された速度の影響に関する説明を以下さらに詳細に述べる。
【0043】
図10に示された概念的な実施例において、知覚加重フィルタ52は以下の式を特徴とする:
【数1】
Figure 2004004897
【0044】
はフォルマント予測フィルタであり、μは知覚加重パラメータであり、実施例においてμ=0.8である。ピッチ合成フィルタ58は以下の式によって特徴付けられる:
【数2】
1/P(z)=1/(1−bz−L
以下に説明される加重フィルタであるフォルマント合成フィルタ60は、以下の式を特徴とする:
【数3】
Figure 2004004897
入力スピーチサンプルs(n)は、加重されたスピーチサンプルx(n)が加算器62の和入力に供給されるように知覚加重フィルタ52によって加重される。知覚加重は、小さい信号パワーしかない周波数でエラーに加重するために使用される。これらの低い信号パワー周波数において、雑音はさらに知覚的に顕著である。合成スピーチサンプルx´(n)は、サンプルx(n)から減算される加算器62の差入力にフォルマント合成フィルタ60から出力される。加算器62から出力されたサンプルの差は、それらが2乗され、その後加算される2乗平均エラー(MSE)素子64に入力される。MSE素子64の計算結果は、ピッチ遅延L、ピッチ利得b、コードブックインデクスIおよびコードブック利得に対する値を生成する最小化素子66に供給される。
【0045】
最小化素子66において、P(z)中のピッチ遅延パラメータLに対する全ての可能な値は、乗算器56から値c(n)と共にピッチ合成フィルタ58に入力される。ピッチ探索中、コードブックからの影響はない。すなわちc(n)=0である。入力スピーチと合成スピーチとの間の加重されたエラーを最小化するLおよびbの値は最小化素子66によって選択される。ピッチ合成フィルタ58は値p(n)を生成し、フォルマント合成フィルタ60に出力する。ピッチフィルタに対するピッチ遅延Lおよびピッチ利得bが見出だされると、コードブック探索は同じ方法で行われる。
【0046】
図10は、本発明において行われた解析合成方法を概念的に表したものであることを理解すべきである。本発明の実施例において、フィルタは典型的な閉ループフィードバック構造において使用されない。本発明において、フィードバック接続は探索中に破断され、開ループフォルマント残留物と置換され、以下においてこの詳細を述べる。
【0047】
最小化素子66は、コードブックインデクスIおよびコードブック利得Gに対する値を生成する。コードブックインデクスIにしたがって複数のランダムガウスベクトル値から選択されたコードブック54からの出力値は、ピッチ合成フィルタ58において使用された値c(n)のシーケンスを生成するためにコードブック利得Gによって乗算器56において乗算される。2乗平均エラーを最小化するコードブックインデクスIおよびコードブック利得Gは伝送のために選択される。
【0048】
知覚的加重W(z)は知覚加重フィルタ52によって入力スピーチに、またフォルマント合成フィルタ60内に含まれる加重関数によって合成スピーチに供給されることに留意すべきである。したがって、フォルマント合成フィルタ60は実際に典型的なフォルマント予測フィルタ特性1/[A(z)]と式1の加重関数を結合し、結果的に式3の加重されたフォルマント合成関数を生じさせる加重されたフォルマント合成フィルタである。
【0049】
その代りに、知覚加重フィルタ52は加算器62とMSE素子64との間に位置されることが理解されるべきである。この場合、フォルマント合成フィルタ60は通常のフィルタ特性1/[A(z)]を有する。
【0050】
図11は、図10のエンコーダによるスピーチのエンコード化に含まれるステップのフローチャートを示す。説明のために、速度決定を含むステップが図11のフローチャートに含まれる。デジタル化されたスピーチサンプルはブロック80でサンプリング回路から得られ、その後LPC係数がブロック82でサンプリング回路から計算される。LPC係数計算の一部分としてハミングウインドウおよび自己相関技術が使用される。開始速度決定は、好ましい実施例においてブロック84でフレームエネルギに基づいた重要なフレームに対して行われる。
小さい数のビットでLPC係数を効率的にコード化するために、LPC係数はブロック86でラインスペクトル対(LSP)周波数に変換され、その後ブロック88に伝送するために量子化される。選択として、付加的な速度決定はブロック90で行われ、ブロック92において最初の速度に対するLSPの量子化が不十分であると考えられた場合に速度の増加が行われる。
【0051】
解析下のスピーチフレームの第1のピッチサブフレームに対して、LSP周波数はブロック94でピッチ探索の実行に使用するために挿入され、LPC係数に変換される。ピッチ探索において、コードブック励起はゼロに設定される。ピッチ探索において、可能な各ピッチ遅延Lに対する前述のような合成方法による解析であるブロック96および98において、合成スピーチは元のスピーチと比較される。整数値であるLの各値に対して、最適なピッチ利得bが決定される。Lおよびbの組のうち最適なLおよびb値の組は、合成スピーチと元のスピーチとの間に最小の知覚加重された2乗平均エラーを提供する。そのピッチサブフレームに対して決定されたLおよびbの最適値に対して、値bは対応したL値と共に伝送するためにブロック100で量子化される。ピッチ探索の別の実施例において、値bはピッチ探索の一部分として量子化された値であり、これらの量子化された値はピッチ探索を行う時に使用される。したがって、この構成において、ブロック100におけるピッチ探索後に選択されたb値の量子化は不要である。
【0052】
解析下のスピーチフレームの第1のコードブックサブフレームに対して、ブロック102においてコードブック探索の実行時に使用するために、LSP周波数が補間され、LPC係数に変換される。しかしながら、実施例において全速度でLSP周波数はピッチサブフレームレベルだけに補間される。この補間および変換ステップは、ピッチデータが計算されないため結果が実質的に意味のない速度1/8を除いて、各速度に対するピッチおよびコードブックサブフレーム寸法の差のためにピッチ探索のものに加えてコードブック探索のために実行される。コードブック探索において、ブロック104および106で最適ピッチ遅延Lおよびピッチ利得bの値は、可能な各コードブックインデクスIに対して合成スピーチが元のスピーチと比較されるようにピッチ合成フィルタにおいて使用される。整数値であるIの各値に対して、最適なコードブック利得Gが決定される。IおよびGの値の組のうち最適なIおよびG値の組が合成スピーチと元のスピーチとの間に最小エラーを提供する。そのコードブックサブフレームに対して決定されたIおよびGの最適な値に対して、値Gは対応したI値と共に伝送するためにブロック108で量子化される。コードブック探索の別の実施例において、Gの値はコードブック探索の一部分として量子化され、これらの量子化された値はコードブック探索の実行時に使用される。この別の実施例において、ブロック108におけるコードブック探索後に選択されたG値の量子化は不要である。
【0053】
コードブック探索後、エンコーダ内のデコーダはI、G、Lおよびbの最適値でランされる。エンコーダのデコーダのランは、将来のサブフレームにおける使用のためにエンコーダフィルタメモリを再構成する。
【0054】
ブロック110において、解析が終了されたコードブックサブフレームがピッチ探索が行われたピッチサブフレームに対応したコードブックサブフレームの組の最後のコードブックサブフレームであるか否かを決定するために検査が行われる。換言すると、ピッチサブフレームに対応したコードブックサブフレームがさらに存在しているか否かに関する決定が行われる。実施例において、1ピッチサブフレーム当り2つのコードブックサブフレームだけが存在している。ピッチサブフレームに対応した別のコードブックサブフレームがあることが決定された場合、ステップ102乃至ステップ108はそのコードブックサブフレームに対して反復される。
【0055】
ピッチサブフレームに対応したコードブックサブフレームがなければ、ブロック112においてその他のピッチサブフレームが解析下のスピーチフレーム内に存在しているか否かを決定するために検査が行われ、各ピッチサブフレームおよび対応したコードブックサブフレームに対してステップ94乃至110が反復される。解析下の現在のスピーチフレームに対する全ての計算が終了されたとき、スピーチフレームに対するLPC係数を表す値、各ピッチサブフレームに対するピッチ遅延Lおよび利得b、および各コードブックサブフレームに対するコードブックインデクスIおよび利得Gはブロック114において伝送のためにパックされる。
【0056】
図12を参照すると、LPC係数(αi)に対して受信された値、ピッチ遅延および利得(L&b)およびコードブックインデクスおよび利得(I&G)がスピーチを合成するために使用されるデコーダブロック図が示されている。図12において、図10のように速度情報は説明を簡単にするために考慮しない。データ速度情報はサイド情報として送信されることが可能であり、場合によってはチャンネル復調段で導出されることができる。
【0057】
デコーダは、受信されたコードブックインデクスを備えた、すなわち1/8速度のランダムシードを提供するコードブック130から構成されている。コードブック130からの出力は乗算器132の1つの入力に供給され、一方乗算器132の別の入力はコードブック利得Gを受信する。乗算器132の出力は、ピッチ遅延Lおよび利得bと共にピッチ合成フィルタ134に供給される。ピッチ合成フィルタ134からの出力は、LPC係数αと共にフォルマント合成フィルタ136に供給される。フォルマント合成フィルタ136からの出力は、再構成されたスピーチがフィルタ処理されて出力される適応ポストフィルタ138に供給される。以下説明するように、デコーダの変形はエンコーダ内において行われる。エンコーダのデコーダは適応ポストフィルタ138を含まないが、知覚加重フィルタを含んでいる。
【0058】
図13は、図12のデコーダの動作に対応したフローチャートである。ブロック150で、デコーダにおいてスピーチは受信されたパラメータから再構成される。特に、ブロック152においてコードブックインデクスの受信された値は、コードベクトルまたはコードブック出力値を生成するコードブックに入力される。乗算器は受信されたコードブック利得Gと共にコードベクトルを受信し、ブロック154でこれらの値を乗算し、結果的な信号がピッチ合成フィルタに供給される。コードブック利得Gは、受信されたDPCMパラメータをデコード化し、逆量子化することによって再構成されることに留意しなければならない。ピッチ合成フィルタは、ブロック156で乗算器出力をフィルタ処理するように乗算器の出力信号と共に受信されたピッチ遅延Lおよび利得b値を供給される。
【0059】
ピッチ合成フィルタによってコードブックベクトルをフィルタ処理することから結果的に生じた値は、フォルマント合成フィルタに入力される。ブロック158において、ピッチ合成フィルタ出力信号のフィルタ処理に使用するためにLPC係数αもまたフォルマント合成フィルタに供給される。LPC係数は、量子化されたLSP周波数に受信されたDPCMパラメータをデコード化し、LSP周波数を逆量子化し、LPC係数αiにLSP周波数を変換することによって補間のためにデコーダで再構成される。ブロック160において、フォルマント合成フィルタからの出力は量子化雑音がマスクされる適応ポストフィルタに供給され、再構成されたスピーチが利得制御される。ブロック162において、再構成されたスピーチはアナログ形態への変換のために出力される。
【0060】
図14および図15のブロック図を参照すると、本発明のスピーチエンコード技術がさらに詳細に示されている。図14において、デジタル化されたスピーチサンプルの各フレームは、自己相関サブシステム202における自己相関係数の計算前に入力スピーチがウインドウ処理されるハミングウインドウサブシステム200に供給される。
【0061】
図16においてハミングウインドウサブシステム200および自己相関サブシステム202の1実施例が示されている。ハミングウインドウサブシステム200は検索表250、典型的には80×16ビットの読取り専用メモリ(ROM)および乗算器252から構成されている。各速度に対してスピーチのウインドウは、160サンプル長である各解析フレームの139番目と140番目のサンプル間に中心を有する。したがって、自己相関係数を計算するウインドウは、60サンプルだけ解析フレームからずらされる。
【0062】
ウインドウ処理は、ハミングウインドウが中心に関して対称的であるため、160個のWH(n)値の80個を含むROM表を使用して実行される。ハミングウインドウのオフセットは、解析フレームの第1のサンプルに関して60個の位置だけROMのアドレスポインタを歪めることによって行われる。これらの値は、乗算器252によって対応した入力スピーチサンプルと1度正確に乗算される。s(n)を解析ウインドウ中の入力スピーチ信号とする。ウインドウ処理されたスピーチ信号sw(n)は次のように定められる:
【数4】
Figure 2004004897
【0063】
検索表250の内容の例示的な16進法の値は表IIに示されている。これらの値は、14の分数ビットを有する2の補数として表され、表は左から右、上から下の順序で読取られる。
【表2】
Figure 2004004897
【0064】
自己相関サブシステム202はレジスタ254、マルチプレクサ256、シフトレジスタ258、乗算器260、加算器262、循環シフトジスタ264およびバッファ266から構成されている。ウインドウ化されたスピーチサンプルSw(n)は20m秒ごとに計算され、レジスタ254にラッチされる。サンプルSw(0)において、LPC解析フレームの第1のサンプル、シフトレジスタ258および264は0にリセットされる。各新しいサンプルSw(n)において、マルチプレクサ256はサンプルがレジスタ254から入力することを可能にする新しいサンプル選択信号を受信する。新しいサンプルw(n)はまたシフトレジスタ258の最後の位置SR10にあるサンプルSw(n−10)によって乗算される乗算器260に供給される。結果的な値は循環シフトレジスタ264の最後の位置CSR11にある値と加算器262において加算される。
【0065】
シフトレジスタ258および260が一度クロックされると、シフトレジスタ258の第1の位置SR1においてSw(n)によりSw(n−1)を置換し、位置CSR10における前の値を置換する。シフトレジスタ258のクロック時に、新しいサンプル選択信号は、シフトレジスタ260の現在の位置SR10におけるサンプルSw(n−9)がマルチプレクサ256に入力することが許容されるようにマルチプレクサ256への入力から除去される。循環シフトレジスタ264において、位置CSR11における前の値は第1の位置CSR1にシフトされる。マルチプレクサから除去された新しいサンプル選択信号により、シフトレジスタ258は循環シフトレジスタ264と同様にシフトレジスタにおいてデータの循環シフトを行うように設定する。
【0066】
シフトレジスタ258および264の両者は、11回の乗算/累算動作が実行されるように全ての各サンプルにおいて11回クロックされる。160個のサンプルがクロックされた後、循環シフトレジスタ264に含まれる自己相関結果は値R(0)−R(10)としてバッファ266中にクロックされる。全てのシフトレジスタはゼロにリセットされ、プロセスはウインドウ化されたスピーチサンプルの次のフレームに対して反復する。
【0067】
図14を参照すると、自己相関係数がスピーチフレームに対して一度計算されると、速度決定サブシステム204およびLPC解析サブシステム206はフレームデータ速度およびLPC係数をそれぞれ計算するためにこのデータを使用する。これらの動作は互いに独立しているため、それらは任意の順序で、または同時に計算される。ここにおいて説明のために、速度決定を最初に説明する。
【0068】
速度決定サブシステム204は(1)現在のフレームの速度を決定し、(2)背景雑音レベルの新しい評価を計算する2つの機能を有する。現在の解析フレームに対する速度は最初に現在のフレームエネルギ、背景雑音レベルの前の評価、前の速度および制御マイクロプロセッサからの速度命令に基づいて決定される。新しい背景雑音レベルは、背景雑音レベルの前の評価および現在のフレームエネルギを使用して評価される。
【0069】
本発明は、速度決定のために適用しきい値技術を使用する。背景雑音が変化すると、速度を選択する時に使用されるしきい値はそのように変化する。実施例において、3つのしきい値は速度選択RTpを予備的に決定するために計算される。しきい値は前の背景雑音評価の直角位相関数であり、以下のように示される:
【数5】
Figure 2004004897
【0070】
ここで、Bは前の背景雑音評価である。
【0071】
フレームエネルギは、3つのしきい値T1(B)、T2(B)およびT3(B)に対して比較される。フレームエネルギが3つの全てのしきい値より下である場合、伝送の最低速度(1kbps)、RTp=4である速度1/8が選択される。フレームエネルギが2つのしきい値より下である場合、伝送の第2の速度(2kbps)、RTp=3である速度1/4が選択される。フレームエネルギがただ1つのしきい値より下である場合、伝送の第3の速度(4kbps)、RTp=2である速度1/2が選択される。フレームエネルギが全てのしきい値より上である場合、伝送の最高速度(8kbps)、RTp=1である速度1が選択される。
【0072】
予備速度RTpは前のフレームの最終速度RTrに基づいて修正されてもよい。予備速度RTpが前のフレームの最終速度マイナス1(RTr−1)より小さい場合、中間速度RTmが設定され、ここでRTm=(RTr−1)である。この修正プロセスは、高エネルギ信号から低エネルギ信号への転移が発生した場合に速度をゆっくりとして傾斜で低下させる。しかしながら、開始速度選択が前の速度マイナス1(RTr−1)に等しいか、またはそれより大きい場合、中間速度RTmは予備速度RTpと同じに、すなわちRTm=RTpに設定される。この状況において、低エネルギ信号から高エネルギ信号への転移が発生したとき、速度は直に増加する。
【0073】
最後に、中間速度RTmはさらにマイクロプロセッサからの速度制限命令によって修正される。速度RTmがマイクロプロセッサによって許容された最高速度より大きい場合、開始速度RTiは最高許容速度に設定される。同様に、中間速度RTmがマイクロプロセッサによって許容された最低速度より小さい場合、開始速度RTiは最低許容値に設定される。
【0074】
ある場合、マイクロプロセッサによって決定された速度で全てのスピーチをコード化することが所望される。速度制限命令は、所望される速度に最大および最小許容速度を設定することによって所望される速度でフレーム速度を設定するために使用されることができる。速度制限命令は、速度インターロック並びにかすみおよびバースト伝送のような特別な速度制御状況に対して使用され、これら両者については以下説明される。
【0075】
図17は速度決定アルゴリズムの1実施例を提供する。計算をスタートするために、レジスタ270は加算器272に供給される値1により予め負荷される。循環シフトレジスタ274,276および278はそれぞれ直角位相しきい値の式(7)乃至(9)の第1、第2および第3の係数により負荷される。例えば、循環シフトレジスタ274の最後、中間および最初の位置はそれぞれT1,T2およびT3が計算される式の第1の係数により負荷される。同様に、循環シフトレジスタ276の最後、中間および最初の位置はそれぞれT1,T2およびT3が計算される式の第2の係数により負荷される。最後に、循環シフトレジスタ278の最後、中間および最初の位置はそれぞれT1,T2およびT3が計算される式の定数の項により負荷される。各循環シフトレジスタ274,276および278において、値は最後の位置から出力される。
【0076】
第1のしきい値T1を計算する時、前のフレームの背景雑音評価Bは乗算器280においてそれ自身の値を乗算することによって平方される。結果的な値B2の値は、循環シフトレジスタ274の最後の位置から出力された第1の係数 −5.544613(10−6)により乗算される。この結果的な値は、乗算器284からの背景雑音Bと循環シフトレジスタ276の最後の位置から出力された第2の係数4.047152の積と加算器286において加算される。その後、加算器286からの出力値は、循環シフトレジスタ278の最後の位置から出力された定数項363.1293と加算器288において加算される。加算器288からの出力はT1の計算された値である。
【0077】
加算器288から出力されたT1の計算された値は、実施例では自己相関サブシステムから供給された直線ドメイン中の値R(0)であるフレームエネルギEfから加算器290において減算される。
【0078】
別の実施例において、フレームエネルギEfはそれが実効的なウインドウ長により正規化された第1の自己相関係数R(0)の対数によって近似されるdBの対数ドメインで表される:
【数6】
Figure 2004004897
【0079】
ここでLAは自己相関ウインドウ長である。音声活動はまたピッチ予測利得またはフォルマント予測利得Gaを含む種々の別のパラメータから測定されてもよいことが理解されなければならない:
【数7】
Figure 2004004897
【0080】
ここでE(10)は、10番目の反復後の予測残留エネルギであり、E(0)はR(0)と同じであるLPC解析に関して以下説明するように最初のLPC予測残留エネルギである。
【0081】
加算器290の出力から、結果的な2の補数差の符号ビットの補数は比較器またはリミタ292によって抽出され、レジスタ270の出力と加算される加算器272に供給される。したがって、R(0)とT1との間の差が正ならば、レジスタ270は1だけインクレメントされる。差が負ならば、レジスタ270は同じ状態である。
【0082】
循環レジスタ274、276および278はその後循環され、T2に対する式である式(8)の係数がその出力に現れる。しきい値T2を計算し、フレームエネルギとそれを比較するプロセスはしきい値T1に対するプロセスに関して述べられたように反復される。循環レジスタ274、276および278は、T3に対する式である式(9)の係数がその出力に現れるように循環。しきい値T3に対する計算およびフレームエネルギに対する比較は上記のように行われる。3つのしきい値計算および比較の終了後、レジスタ270は開始速度評価RTiを含む。予備速度評価RTpは速度ランプダウン論理回路294に供給される。前のフレーム最終速度RTrはまたレジスタ298に蓄積されるLSP周波数量子化サブシステムから論理回路294に供給される。論理回路296は値(RTr−1)を計算し、予備速度評価RTpおよび値(RTr−1)の大きいほうを出力として供給する。値RTmは速度リミタ論理回路296に供給される。
【0083】
上記のように、マイクロプロセッサはボコーダ、特に論理回路296に速度制限命令を供給する。デジタル信号プロセッサ構造において、この命令はエンコード化プロセスのLPC解析部分が終了される前に論理回路296において受信される。論理回路296は速度が速度制限を越えず、それが制限を越えた場合には値RTmを修正することを保証する。値RTmが許容速度の範囲内にある場合、それは開始速度値RTiとして論理回路296から出力される。開始速度値RTiは、図14のLSP量子化サブシステム210に論理回路296から出力される。
【0084】
上記のような背景雑音評価は、適用速度しきい値を計算する時に使用される。現在のフレームに対して、前のフレーム背景雑音評価Bは現在のフレームに対する速度しきい値を設定する時に使用される。しかしながら、各フレームに対して背景雑音評価は、次のフレームに対する速度しきい値の決定に使用するために更新される。新しい背景雑音評価B´は、前のフレーム背景雑音評価Bおよび現在のフレームエネルギEfに基づいて現在のフレームにおいて決定される。
【0085】
次のフレーム中に使用するための新しい背景雑音評価B´の決定(前のフレームの背景雑音評価Bのように)において、2つの値が計算される。第1の値V1は現在のフレームエネルギEだけである。第2の値VはB+1およびKBの大きいほうであり、ここでK=1.00547である。第2の値が大きくなり過ぎることを阻止するために、それは強制的に大きい定数M=160,000より下にされる。2つの値VまたはVの小さいほうが新しい背景雑音評価B´として選択される。数学的には、
【数8】
Figure 2004004897
【0086】
ここで最小(x,y)はxおよびyの最小値であり、最大(x,y)はxおよびyの最大値である。
【0087】
図17はさらに背景雑音評価アルゴリズムの実施例を示す。第1の値V1は、マルチプレクサ300の1つの入力に直接供給される現在のフレームエネルギEfだけである。
【0088】
第2の値V2は、最初に計算された値KBおよびB+1から計算される。値KBおよびB+1を計算する時に、レジスタ302に蓄積された前のフレーム背景雑音評価Bは、加算器304および乗算器306に出力される。現在のフレームにおける使用のためにレジスタ302に蓄積された前のフレーム背景雑音評価Bは、前のフレームにおいて計算された新しい背景雑音評価B´と同じであることを留意しなければならない。加算器304はまた項B+1を生成するように値Bとの加算のために1の入力値を供給される。乗算器306はまた項KBを生成するように値Bとの乗算のためにKの入力値を供給される。項B+1およびKBはそれぞれ乗算器308および加算器310の別々の両入力に加算器304および乗算器306から出力される。
【0089】
加算器310および比較器またはリミタ312は、項B+1およびKBの大きいほうの選択時に使用される。加算器310はKBから項B+1を減算し、比較器またはリミタ312に結果的な値を供給する。リミタ312は、項B+1およびKBの大きいほうとして出力を選択するようにマルチプレクサ308に制御信号を供給する。選択された項B+1またはKBは、定数値Mより下の場合に選択された項を、或いは値Mより上の場合には値Mを供給する飽和タイプのリミタであるリミタ314にマルチプレクサ308から出力される。リミタ314からの出力は第2の入力としてマルチプレクサ300に、また1入力として加算器316に供給される。
【0090】
加算器316はまた別の入力においてフレームエネルギEfを受信する。加算器316および比較器またはリミタ318は、値Efおよびリミタ314から出力された項の小さい方を選択する時に使用される。加算器316は、リミタ314から出力された値からフレームエネルギ値を減算し、比較器またはリミタ318に結果的な値を供給する。リミタ318は、Ef値およびリミタ314からの出力の小さいほうを選択するためにマルチプレクサ300に制御信号を供給する。マルチプレクサ300から出力された選択された値は、前のフレーム背景雑音評価Bとして次のフレーム中に使用するために蓄積されるレジスタ302に新しい背景雑音評価B´として供給される。
【0091】
再び図14,15を参照すると、各自己相関係数R(0)乃至R(10)は自己相関サブシステム202からLPC解析サブシステム206に出力される。LPC係数は、知覚加重フィルタ52およびフォルマント合成フィルタ60の両者においてLPC解析サブシステム206中で計算される。
【0092】
LPC係数は、文献( RabinerおよびSchafer氏による“ Digital Processing of Speech Signals”,Prentice−Hall,Inc., 1978年)において論じられるようにダービンの循環を使用する自己相関方法によって得られる。この技術は、LPC係数を得るための効率的な計算方法である。アルゴリズムは以下の式で表されることができる:
【数9】
Figure 2004004897
【0093】
10個のLPC係数は、 1≦j≦10に対してαj (10)のラベルを付けられる。
【0094】
LPC係数をエンコードする前に、フィルタの安定性が保証されなければならない。フィルタの安定性は、ピーク周波数応答の大きさを減少し、一方ピークの帯域幅を拡大する少量だけ内側にフィルタ極を放射方向にスケールすることによって達成される。この技術は一般に帯域幅拡大として知られており、さらに文献( Tohkura氏他による“SpectralSmoothing inPARCORSpeechAnalysis−Synthesis”,ASSP Transactions,1978年12月)に示されている。この場合、帯域幅拡大は各LPC係数にスケールすることによって効率的に実行されることができる。したがって、表IIIに示されているように、結果的なLPC係数はそれぞれLPC解析サブシステム206の最終的な出力LPC係数α1乃至α10を生成するように対応した6つの値によって乗算される。表IIIに与えられた値は2の補数表記で15の小数ビットを持つヘキサデシマールで与えられる。この形態において、値 0×8000は値−1.0を表し、値 0×7333(または29491)は0.899994=29491/32768を表す。
【表3】
Figure 2004004897
【0095】
動作は、二重正確度すなわち32ビット除算、乗算および加算で実行されることが好ましい。二重正確度の正確さは自己相関関数およびフィルタ係数のダイナミック範囲を維持するために好ましい。
【0096】
図18において、上記の式(15)乃至(20)を実行するLPCサブシステム206の実施例のブロック図が示されている。LPCサブシステム206は、主計算回路330および主計算回路330のレジスタを更新するために使用される2つのバッファ更新回路332および334の3つの回路部分から構成されている。計算はバッファ340に値R(1)乃至R(10)を最初に負荷することによって開始される。計算を開始するために、レジスタ348はマルチプレクサ344を介して値R(1)により予め負荷される。レジスタはマルチプレクサ350を介してR(0)により初期化され、バッファ352(10個のαj(i―1)値を保持する)はマルチプレクサ354を介して全てゼロに初期化され、バッファ356(10個のαj (i)値を保持する)はマルチプレクサ358を介して全てゼロに初期化され、iは計算サイクルのために1に設定される。簡明化のために、iおよびjに対するカウンタおよびその他の計算サイクル制御装置は示されていないが、このタイプの論理回路の設計および集積はデジタル論理回路設計で当業者の能力内において容易に実行される。
【0097】
αj(i―1)値は、式(14)に示されているような項kiE(i―1)を計算するためにバッファ356から出力される。各値R(i−j)は、乗算器360におけるαj(i―1)値との乗算のためにバッファ340から出力される。各結果的な値は、レジスタ346中の値から加算器362において減算される。各減算の結果は、次の項が減算されるレジスタ346に蓄積される。式(14)の合計項に示されているように、i番目のサイクルには(i−1)の乗算および累算が存在する。このサイクルの終りにおいて、レジスタ346中の値は値kiを生成するようにレジスタ348からの値E(i―1)により除算器364で除算される。
【0098】
その後、値kiは、上記の式(19)のように値E(i)を計算するためにバッファ更新回路332において使用され、これはkiの次の計算サイクル中に値E(i―1)として使用される。現在のサイクル値kiは、値kiを得るためにそれ自身乗算器366において乗算される。その後、値kiは加算器368において1の値から減算される。この加算の結果値は、乗算器370においてレジスタ348からの値E(i)と乗算される。結果的な値E(i)は、次のサイクルのために値E(i―1)として蓄積するためにマルチプレクサ350を介してレジスタ348に入力される。
【0099】
値kiは、式(15)のように値αi(i)を計算するために使用される。この場合、値kiはマルチプレクサ358を介してバッファ356に入力される。値kiはまた式(18)のように値αj (i−1)から値αj(i)を計算するためにバッファ更新回路334において使用される。バッファ352に現在蓄積されている値は値αj(i)の計算時に使用される。式(18)に示されているように、i番目のサイクルには(i−1)の計算がある。i=1の反復において、このような計算は不要である。i番目のサイクルに対するjの各値に対して、αj(i)の値が計算される。αj(i)の各値の計算時にαi−j(i―1)の各値は加算器374への出力のために乗算器374において値kiと乗算される。加算器374において、値kiαi−j(i―1)は加算器374に入力される値αj(i―1)から減算される。各乗算および加算の結果は、αj(i)の値としてマルチプレクサ358を介してバッファ356に供給される。
【0100】
現在のサイクルに対して値αi(i)およびαj(i)が計算されると、計算されバッファ356に蓄積された値は、マルチプレクサ354を介してバッファ352に出力される。バッファ356に蓄積された値は、バッファ352中の対応した位置に蓄積される。このようにしてバッファ352は、i+1番目のサイクルに対して値kiを計算するために更新される。
【0101】
前のサイクルの終了時に生成されるデータαj(i―1)は、次のサイクル用の更新αj(i)を生成するために現在のサイクル中に使用されることに注意することが重要である。この前のサイクルデータは、次のサイクルのために更新されたデータを完全に生成するために保存されなければならない。したがって、2つのバッファ356および352は、更新されたデータが完全に生成されるまでこの前のサイクルデータを保存するために使用される。
【0102】
上記の説明は、更新された値の計算の終了時におけるバッファ356からバッファ352へのデータの並列伝送に関して示されている。この構造は、単一バッファ構造において発生するような完全な使用前に古いデータを損うことなく古いデータが新しいデータを計算するプロセス全体中に保存されることを保証する。示された構造は、同じ結果を得るために容易に利用できるいくつかの構造の1つである。例えばバッファ352および356は、第1のバッファに蓄積された値から現在のサイクルに対する値kiを計算する時に、更新が使用前に次の計算サイクル中第2のバッファに蓄積されるように多重化されてもよい。この次の計算サイクルにおいて、値kiは第2のバッファに蓄積された値から計算される。第2のバッファ中の値および値kiは、次の計算サイクルに対する更新を生成するために使用され、これらの更新は第1のバッファに蓄積される。このバッファの交互動作は、更新が生成され、一方において更新を生成するために必要とされる進行している値を重ね書きせずに、更新された値を蓄積する計算サイクルの進行の反復を可能にする。この技術の使用が次のサイクルに対する値kiの計算に関連した遅延を最小にする。したがって、kiの計算における乗算/累算の更新はαj(i −1)の次の値が計算されるのと同時に実行されてもよい。
【0103】
最後の計算サイクル(i=10)の終了時にバッファ356に蓄積された10個のLPC係数αj(10)は、対応した最終のLPC係数αjに到達するようにスケールされる。スケール化は、表IIIにおけるヘックス値である検索表342に蓄積されたスケール値がマルチプレクサ344を通過する出力に対して選択されるようにマルチプレクサ344,376および378にスケール選択信号を供給することによって行われる。検索表342に蓄積された値は連続的にクロックされ、乗算器360に入力される。乗算器360はまたレジスタ356から連続的に出力されたαj(10)の値をマルチプレクサ376を介して受信する。スケール化された値は、マルチプレクサ378を介して乗算器360からLPC・LSP変換サブシステム208に出力として出力される(図14,15)。
【0104】
10個の各スケールされたLPC係数を小さい数のビットで効率的にエンコードするために、係数は文献(SoongおよびJuang氏による“LineSpectrumPair(LSP)andSpeechDataCompression”,ICASSP´84)に示されているようにラインスペクトル対周波数に変換される。LSPパラメータの計算は表IVと共に式(21)および(22)で以下に示されている。
【0105】
LSP周波数は、以下の式の0乃至πの間に存在する10個の根である:
【数10】
Figure 2004004897
【0106】
ここでpnおよびqn値はn=1,2,3,4に対するものであり、表IVにおいてそれぞれ定められている。
【表4】
Figure 2004004897
【0107】
表IVにおいて、α1 ,…,α 10の値はLPC解析の結果生じたスケールされた係数である。式(21)および(22)の10個の根は、簡明化のために 0乃至0.5の間でスケールされる。LSP周波数の特性は、LPCフィルタが安定しているならば2つの関数の根は交互することである。すなわち最低の根ωはP(ω)の最低の根であり、次に低い根ωはQ(ω)の最低の根である。10個の周波数のうち、奇数周波数はP(ω)の根であり、偶数周波数はQ(ω)の根である。
【0108】
根の探索は以下のようにして行われる。最初に、上記のようにLPC係数を加算することによって二重正確度でpおよびq係数が計算される。その後、P(ω)はπ/256ラジアンごとに評価され、これらの値は符号変化に対して評価され、それはサブ領域中の根を識別する。根が見出された場合、この領域の2つの境界の間の直線的な補間が根の位置を近似するために実行される。1つのQの根は、周波数の整列特性のためにPの根の各対の間に存在する(第5のQの根は第5のPの根とπとの間に存在する)ことが保証されている。2進法探索は、Qの根の位置を決定するためにPの根の各対の間で実行される。構造を容易にするために、各Pの根は最も近いπ/256値によって近似され、2進法探索がこれらの近似値間において実行される。根が見出されない場合、根が見出だされた最後のフレームからのLSP周波数の前の量子化されていない値が使用される。
【0109】
図19を参照すると、LSP周波数を生成するために使用される回路の実施例が示されている。上記の動作は、モード256でカウンタ402によってアドレスされるコサイン検索表400に二重正確度で蓄積される 0乃至πの間の全体で257個の可能なコサイン値を必要とする。検索表400に入力されるjの各値に対して、cosω, cos 2ω, cos 3ω, cos 4ω, cos 5ωの出力が供給され、ここにおいて:ω=jπ/256(23)
ここでjはカウント値である。
【0110】
検索表400から出力された値cosω, cos 2ω, cos 3ω, cos 4ωは、各乗算器404,406,408および410に入力され、一方値 cos 5ωは合計器412に直接入力される。これらの値は、マルチプレクサ414,416,418および420を介してそれに入力された値p4,p3,p2およびp1のそれぞれと各乗算器404,406,408および410において乗算される。この乗算の結果的な値は、また合計器412に入力される。さらに値p5として、一定の値0.5、すなわち1/2が乗算器424にマルチプレクサ422を通って供給され、この一定の値もまた乗算器424に供給される。乗算器424から出力された結果的な値は別の入力として合計器412に供給される。マルチプレクサ414乃至422は、P(ω)およびQ(ω)の両値の計算に対して同じ回路を使用するようにp/q係数選択信号に応答して値p1乃至p5またはq1乃至q5の間で選択する。p1乃至p5またはq1乃至q5の値を生成する回路は示されていないが、p1乃至p5またはq1乃至q5の値を蓄積するレジスタと共にLPC係数およびp1乃至p5またはq1乃至q5の値を加算および減算する一連の加算器を使用して容易に構成される。
【0111】
合計器412は、場合に応じて出力P(ω)またはQ(ω)を提供するために入力値を合計する。以下の説明を容易にするために、P(ω)の値の場合を考える。Q(ω)の値は、q1乃至q5の値を使用して同様にして計算される。P(ω)の現在の値は合計器412から出力され、レジスタ426に蓄積される。レジスタ426に前に蓄積されたP(ω)の先行した値は、レジスタ428にシフトされる。P(ω)の現在および前の値の符号ビットは、直線補間装置434に送られるエネーブル信号の形態でゼロ交差または符号変化を示すために排他的オアゲート430において排他的オアされる。P(ω)の現在および前の値はまたゼロ交差が発生するP(ω)の2つの値の間の点を補間するためにエネーブル信号に応答する直線補間装置434にレジスタ426および428から出力される。値(j−1)からの距離であるこの直線補間部分的値の結果は、カウンタ256からの値jと共にバッファ436に供給される。ゲート430はまた値jおよび対応した部分的な値FVjの蓄積を可能にするバッファ436にエネーブル信号を供給する。
【0112】
部分的な値は加算器438においてバッファ436からの出力として値jから減算されるか、或はその代りとしてバッファ436への入力としてそれから減算される。別の実施例において、値(j−1)がバッファ436に入力され、部分的な値も入力されるように、バッファ436へのjライン入力におけるレジスタが使用されてもよい。部分的な値は、レジスタ436における蓄積の前またはその出力時に値(j−1)に加算される。いずれの場合でも、j+FVまたは(j−1)+FVの結合された値は入力定数値512によって除算される除算器440に出力される。除算動作は、表記的な2進ワード中の2進法の少数点位置を単に変化するだけで簡単に実行される。この除算動作は、 0乃至0.5の間のLSP周波数に到達するために必要なスケール処理を実行する。
【0113】
P(ω)またはQ(ω)の各関数評価には、5つのコサイン検索表、4つの二重正確度乗算および4つの加算が必要とされる。計算された根は典型的に約13ビットまで正確であり、単一正確度で蓄積される。LSP周波数は量子化のためにLSP量子化サブシステム210(図14,15)に供給される。
【0114】
LSP周波数が計算されると、それらは伝送のために量子化されなければならない。10個の各LSP周波数はバイアス値を中心にほぼ囲んでいる。LSP周波数は、入力スピーチが平坦なスペクトル特性を有し、短期間予測が実行されることができないときにバイアス値を近似することに留意しなければならない。バイアスはエンコーダにおいて減算され、簡単なDPCM量子化器が使用される。デコーダにおいて、バイアスは再び加算される。LPCからLSPへの変換サブシステムに供給されたような各LSP周波数ω乃至ω10に対する16進法の負のバイアス値は、表Vに示されている。表Vに示された値は、部分的な15ビットを持つ2補数である。ヘックス値 0×8000(または−32768)は−1.0を表す。したがって、表Vの第1の値である値 0×fa2f(または−1489)は −0.045441= −1489/32768を表す。
【表5】
Figure 2004004897
【0115】
サブシステムにおいて使用された予測装置は、サブシステム中のバッファに蓄積された前のフレームからの量子化されたLSP周波数の0.9倍である。この0.9の減少定数は、チャンネルエラーが最終的になくなるように挿入される。
【0116】
使用される量子化器は直線的であるが、速度と共にダイナミック範囲およびステップ寸法を変化させる。高速フレームにおいてもまたより多くのビットが各LSP周波数に対して伝送される。表VIにおいて、量子化器のビット割当ておよびダイナミック範囲が各速度で各周波数に対して示されている。例えば、速度1であるωは4ビット(すなわち16レベルに)を使用して均一に量子化され、最も高い量子化レベルは0.025であり、最も低いものは−0.025である。
【表6】
Figure 2004004897
【0117】
速度決定アルゴリズムによって選択された速度に対する量子化範囲が十分に大きくなく、或は傾斜オーバーフローが発生した場合、速度は次に高い速度に高められる。速度はダイナミック範囲が適合されるか、或は全速度に達するまで連続的に高められる。図20において、任意選択速度増加技術の1実施例のブロック図が与えられている。
【0118】
図20は、速度増加回路を含むLSP量子化サブシステム210の一実施例をブロック図で示す。図20において、現在のフレームのLSP周波数は除算器440(図19)からレジスタ442に出力され、これにおいて次のフレームにおける速度増加決定中の出力のために蓄積される。前のフレームのLSP周波数および現在のフレームのLSP周波数は、現在のフレーム速度増加決定のためにそれぞれレジスタ442および除算器440から速度増加論理回路444に出力される。速度増加論理回路444はまた速度決定サブシステム204から速度制限命令と共に開始速度決定を受取る。速度増加が必要であるか否かを決定する時、論理回路444は、現在および前のフレームのLSP周波数間の差の2乗の和に基づいて現在のフレームのLSP周波数と前のフレームのLSP周波数を比較する。その後、結果的な値はしきい値と比較され、しきい値が越された場合に、高品質のSSのエンコード化を保証するために速度の増加が指示される。しきい値を越えた時、論理回路444はエンコーダにおいて使用される最終速度の出力を供給するように1速度レベルだけ開始速度をインクレメントする。
【0119】
図20において、各LSP周波数の値ω乃至ω10は対応したバイアス値と共に一度に1つづつ加算器450に入力される。バイアス値は入力LSP値から減算され、その結果的な値が加算器452に出力される。加算器452はまた減少定数と乗算された前のフレームの対応したLSP値である予測値を入力として受信する。予測値は、加算器452によって加算器450の出力値から減算される。加算器452の出力は量子化器454に入力として供給される。
【0120】
量子化器454は、リミタ456、最小ダイナミック範囲検索表458、反転ステップ寸法検索表460、加算器462、乗算器464およびビットマスク466から構成されている。量子化は、入力値が量子化器454のダイナミック範囲内にあるか否かを最初に決定することによって量子化器454において実行される。入力値は、入力が検索表458にって与えられた境界を越えた場合に、ダイナミック範囲の上限および下限に入力値を制限するリミタ456に供給される。検索表458は速度入力およびそれに入力されたLSP周波数インデクスiに応答してリミタ456に対して表VIにしたがって蓄積された境界を与える。リミタ456から出力された値は加算器462に入力され、検索表458によって与えられた最小ダイナミック範囲の最小がそれから減算される。検索表458から出力された値は、最小のダイナミック範囲の値にしたがって速度およびLSP周波数インデクスiによって決定され、表VIに示されたように値の符号を無視する。例えば(全速度,ω)に対する検索表458中の値は0.025である。
【0121】
加算器462からの出力は、検索表460から選択された値により乗算器464において乗算される。検索表460は、表VIに示された値にしたがって各速度における各LSP値に対するステップ寸法の逆数に対応した値を含む。検索表460から出力された値は、速度およびLSP周波数インデクスiによって選択される。各速度およびLSP周波数インデクスiに対して、検索表460に蓄積された値は量[(2n−1)/ダイナミック範囲]であり、ここにおいてnは量子化された値を表すビットの数である。例えば、(速度1,ω)に対する検索表460中の値は(15/0.05)または300である。
【0122】
乗算器464からの出力は、ビットマスク466に供給された0乃至2n−1の間の値である。速度およびLSP周波数インデクスiに応答するビットマスク466は、表VIにしたがって適切な数のビットを入力値から抽出する。抽出されたビットは、ビット制限出力Δωを提供するように入力値のn整数値ビットである。値Δωは、LSP係数を表すチャンネル上を伝送される量子化された非バイアス微分エンコード化LSP周波数である。
【0123】
値Δωはまた反転量子化器468,加算器470,バッファ472および乗算器474から構成された予測装置を通してフィードバックされる。反転量子化器468は、ステップ寸法検索表476,最小ダイナミック範囲検索表478,乗算器480および加算器482から構成されている。
【0124】
値Δωは、検索表476から選択された値と共に乗算器480に入力される。検索表476は、表VIに示された値にしたがって各速度における各LSP値に対するステップ寸法に対応した値を含む。検索表476から出力された値は、速度およびLSP周波数インデクスiによって選択される。各速度およびLSP周波数インデクスiに対して、検索表460に蓄積された値は量[ダイナミック範囲/(2n−1)]であり、ここにおいてnは量子化された値を表すビットの数である。乗算器480は入力値を乗算し、加算器482に出力を供給する。
【0125】
加算器482は、検索表478から別の入力として値を受信する。検索表478から出力された値は、最小ダイナミック範囲値にしたがって速度およびLSP周波数インデクスiによって決定され、表VIに示されたように値の符号を無視する。加算器482は、検索表478によって与えられた最小ダイナミック範囲値に乗算器480から出力された値を加算し、結果な値が加算器470に出力される。
【0126】
加算器470は、乗算器474から出力された予測値を別の入力として受信する。これらの値は加算器470において加算され、10ワード蓄積バッファ472に蓄積される。現在のフレーム中にバッファ472から出力された前のフレームの各値は、乗算器474において定数0.9により乗算される。乗算器474から出力されたような予測値は上記のように両加算器452および470に供給される。
【0127】
現在のフレームにおいて、バッファ472に蓄積された値は前のフレームの再構成されたLPS値マイナスバイアス値である。現在のフレームにおいて同様に、加算器470から出力された値はまたバイアス値のない現在のフレームの再構成されたLPS値である。現在のフレームにおいて、バッファ472および加算器470からの出力は、バイアスが値に加算される加算器484および486にそれぞれ供給される。加算器484および486から出力された値はそれぞれ前のフレームの再構成されたLSP周波数値および現在のフレームの再構成されたLSP周波数値である。LSP平滑化は式(24)にしたがって低速度で行われる平滑化されたLSP=a(現在のLSP)+(1−a)(前のLSP)(24)
ここにおいて、
a=全速度に対して0
a=1/2速度に対して0.1
a=1/4速度に対して0.5
a=1/8速度に対して0.85
前のフレーム(f−1)の再構成されたLSP周波数ω´i,f−1の値および現在のフレーム(f)の再構成されたLSP周波数ω´i,fの値は量子化サブシステム210からピッチサブフレームLSP補間サブシステム216およびコードブックサブフレームLSP補間サブシステム226に出力される。量子化されたLSP周波数値Δωは、伝送のためにLSP量子化サブシステム210からデータアセンブラサブシステム236に出力される。
【0128】
以下説明するように加重フィルタおよびフォルマント合成フィルタにおいて使用されたLPC係数は、エンコードされるピッチサブフレームに適している。ピッチサブフレームに対して、LPC係数の補間は各ピッチサブフレームに対して1度実行され、表VIIに示されている通りである:
【表7】
Figure 2004004897
【0129】
ピッチサブフレームカウンタ224は、ピッチパラメータが計算されるピッチサブフレームの追跡を維持するために使用され、カウンタ出力はピッチサブフレームLSP補間時に使用するためにピッチサブフレームLSP補間サブシステム216に供給される。ピッチサブフレームカウンタ224はまた選択された速度に対するピッチサブフレームの終了を示す出力をデータパッキングサブシステム236に供給する。
【0130】
図21は、適切なピッチサブフレームに対してLSP周波数を補間するピッチサブフレームLSP補間サブシステム216の1実施例を示す。図21において、前および現在のLSP周波数ω´i,f−1およびω´i,fは、それぞれLSP量子化サブシステムから乗算器500および502に出力され、乗算器500および502においてメモリ504から与えられた定数によりそれぞれ乗算される。メモリ504は1組の定数値を蓄積し、以下説明するようにピッチサブフレームカウンタからのピッチサブフレーム数の入力にしたがって、前および現在のフレームLSP値との乗算のために表VIIに示されたように定数の出力を供給する。乗算器500および502の出力は、表VIIの式にしたがってピッチサブフレームにLSP周波数値を供給するために加算器506において加算される。各ピッチサブフレームに対して、LSP周波数の補間が行われると、逆LSP・LPC変換がA(z)および知覚加重フィルタの現在の係数を得るために実行される。したがって、補間されたLSP周波数値は図14,15のLSP・LPC変換サブシステム218に供給される。
【0131】
LSP・LPC変換サブシステム218は、スピーチを再合成する時に使用するためにLPC係数に補間されたLSP周波数を再度変換する。上記の参照文献(SoongおよびJuang氏による“ Line Spectrum Pair(LSP)and Speech DataCompression”)において、変換プロセスにおいて本発明中で実行されたアルゴリズムが完全に説明され、また導き出される。計算は、P(z)およびQ(z)は式(25)によってLSP周波数に関して表されることができる:
【数11】
Figure 2004004897
【0132】
計算は最初に奇数周波数iの全てに対して値2cos(ω)を計算することによって実行される。この計算は、ゼロ(0)に関して第5のオーダーの単一正確度のコサインのテイラー級数拡張を使用して行われる。コサイン表における最も近い点に関するテイラー拡張はより正確であることが潜在的に可能であるが、0に関する拡張は十分な正確さを達成し、過剰な量の計算を含まない。
【0133】
次に、Pの多項式の係数が計算される。多項式の積の係数は、個々の多項式の係数のシーケンスの畳み込みである。その後、上記の式(25)におけるzの公称的な係数の6つのシーケンス:[1,−2cos(ω),1]、[1,−2cos(ω),1]、…、[1,−2cos(ω),1]および[1,1]の畳み込みが計算される。
【0134】
Pの多項式が計算されると、Qの多項式に対して同じ過程が反復され、上記の式(26)におけるzの公称的な係数の6つのシーケンス:[1,−2cos(ω),1]、[1,−2cos(ω),1]、…、[1,−2cos(ω10),1]および[1,−1]および適切な係数が合計され、2により除算される。すなわちLPC係数を生成するために1ビットだけシフトされる。
【0135】
図21はさらにLSP・LPC変換サブシステムの一実施例を詳細に示す。回路部分508は、ωの入力値から −2cos(ω)の値を計算する。回路部分508は、バッファ509;加算器510および515;乗算器511,512,514,516および518並びにレジスタ513および516から構成されている。 −2cos(ω)に対して値を計算する時、レジスタ513および516はゼロに初期化される。この回路は sin(ω)を計算するため、ωiは加算器515において最初に入力定数値π/2から減算される。この値は乗算器511で2乗され、その後値(π/2−ω,(π/2−ω,(π/2−ωおよび(π/2−ωは、乗算器512およびレジスタ513を使用して連続的に計算される。
【0136】テイラー級数拡張係数c[1]乃至c[4]は、乗算器512から出力された値と共に乗算器514に連続的に供給される。乗算器514から出力された値は加算器515に入力され、その加算器515において出力:c[1](π/2−ω+c[2](π/2−ω+c[3](π/2−ω+c[4](π/2−ωを乗算器517に供給するように合計される。レジスタ516から乗算器517への入力は加算器510からの出力(π/2−ω)と乗算器517において乗算される。乗算器517からの出力すなわち値 cos(ω)は出力 −2cos(ω)を供給するように乗算器518において定数−2と乗算される。値 −2cos(ω)は回路部分520に供給される。
【0137】
回路部分520はpの多項式の係数の計算に使用される。回路部分520は、メモリ521、乗算器522および加算器523から構成されている。メモリ位置P(1)…P(11)のアレイは1に設定されるP(1)を除いて0に初期化される。古いインデクスの −2cos(ω)の値は、1≦i≦5,1≦j≦2i+1,j<1に対してP(j)=0である[1, −2cos(ω),1]の畳み込みを実行するために乗算器524に供給される。回路部分520はQの多項式の係数を計算する時に複製される(示されていない)。結果的なP(1)…P(11)およびQ(1)…Q(11)の最終の新しい値は回路部分524に供給される。
【0138】
回路部分524は、i=1乃至i=10に対するピッチサブフレームの10個のLPC係数αの計算を完了するために設けられている。回路部分524は、バッファ525および526、加算器528,528および529、除算器またはビットシフタ530から構成されている。最終のP(i)およびQ(i)値は、バッファ525および526に蓄積される。P(i)およびP(i+1)の値は加算器527において加算され、一方対応するQ(i)およびQ(i+1)の値は 1≦i≦10に対して加算器528において減算される。加算器527および528の各出力P(z)およびQ(z)は加算器529に入力されてそこで合計される。加算器の出力は1位置だけビットをシフトすることによって2で除算される。値[P(z)+Q(z)]/2として出力されるる。値[P(z)+Q(z)]/2の各ビットシフトされた値は出力LPC係数αである。ピッチサブフレームLPC係数は、図14,15のピッチ探索サブシステム220に供給される。
【0139】
LSP周波数はまた全速度を除いて選択された速度によって決定されるように各コードブックサブフレームに対して補間される。補間は、ピッチサブフレームLSP補間と同様に計算される。コードブックサブフレームLSP補間は、コードブックサブフレームLSP補間サブシステム226において計算され、LSP・LPC変換サブシステム228に供給され、そこにおける変換はLSP・LPC変換サブシステム218の場合と同様に行われる。
【0140】
図10を参照して示されているように、ピッチ探索はパラメータを使用して入力スピーチと合成スピーチとの間のエラーを最小にするこれらのパラメータを選択することによってエンコード処理が行われる合成技術による解析である。ピッチ探索において、スピーチは、応答が式(2)で表されるピッチ合成フィルタを使用して合成される。各20m秒のスピーチフレームは、上記に示されたようにフレームに対して選択されたデータ速度に依存する多数のピッチサブフレームにさらに分割される。1ピッチサブフレーム当り一度ピッチパラメータbとG、すなわちピッチ利得および遅延がそれぞれ計算される。実施例において、ピッチ遅延Lは伝送のために17乃至143を範囲とし、L16はb=0の場合に反転される。
【0141】
スピーチコーダは、式(1)で示された形態の知覚雑音加重フィルタを使用する。上記のように、知覚加重フィルタの目的はエラー関連雑音の影響を減少するように小さいパワーの周波数のエラーを加重することである。知覚加重フィルタは、前に見出だされた短期間予測フィルタから得られる。加重フィルタおよび以下説明されるフォルマント合成フィルタにおいて使用されるLPC係数は、エンコード処理されているサブフレームに適した補間値である。
【0142】
解析合成動作の実行時、スピーチデコーダ/シンセサイザの複写がエンコーダにおいて使用される。スピーチエンコーダにおいて使用される合成フィルタの形態は式(3)および(4)によって与えられる。式(3)および(4)は、知覚加重フィルタによって後続されるデコーダスピーチ合成フィルタに対応し、したがって加重された合成フィルタと呼ぶ。
【0143】
ピッチ探索は、現在のフレームにおけるコードブックからのゼロ供給すなわちG=0を仮定して実行される。各可能なピッチ遅延Lに対して、スピーチは合成され、元のスピーチと比較される。入力スピーチと合成されたスピーチとの間のエラーは、その2乗平均エラー(MSE)が計算される前に知覚加重フィルタによって加重される。その目的は知覚加重スピーチと知覚加重合成スピーチとの間のエラーを最小にする、Lおよびbの全ての可能な値からLおよびbの値を得ることである。エラーの最小化は次の式によって表される:
【数12】
Figure 2004004897
【0144】
ここにおいてLpは、実施例では全速度ピッチサブフレームに対して40であるピッチサブフレーム中のサンプルの数である。MSEを最小にするピッチ利得bが計算される。これらの計算はLの全ての許容値に対して繰返され、最小MSEを生成するLおよびbはピッチフィルタに対して選択される。
【0145】
最適ピッチ遅延の計算は、n=−Lmax乃至n=(Lp−Lmin)−1の間の全ての時間中フォルマント残留サンプル[図10中のp(n)]を含み、ここにおいてLmaxは最大ピッチ遅延値であり、Lminは最小ピッチ遅延値であり、Lpは選択された速度に対するピッチサブフレーム長であり、ここでn=0がピッチサブフレームのスタートである。実施例において、Lmax=143およびLmin=17である。図22に示された符号付け方式を使用すると、速度1/4に対してn=−143乃至n=142であり、速度1/2に対してn=−143乃至n=62であり、速度1に対してn=−143乃至n=22である。n<0に対して、フォルマント残留サンプルはピッチフィルタメモリに保持された前のピッチサブフレームからのピッチフィルタの出力だけであり、閉ループフォルマント残留サンプルと呼ばれる。n≧0に対して、フォルマント残留サンプルは入力が現在の解析フレームスピーチサンプルであるA(z)のフィルタ特性を有するフォルマント解析フィルタの出力である。n≧0に対して、フォルマント残留サンプルは開ループフォルマント残留サンプルと呼ばれ、ピッチフィルタおよびコードブックがこのサブフレームで完全な予測を行った場合、正確にp(n)である。関連したフォルマント残留サンプル値からの最適ピッチ遅延の計算の説明は、さらに図22乃至図25を参照して行われる。
【0146】
ピッチ探索は143個の再構成された閉ループフォルマント残留サンプルに対して行われ、すなわちn<0に対しp(n)およびn≧0に対してpo(n)であるLp−Lmin非量子化開ループフォルマント残留サンプルに対してピッチ探索が実行される。探索はLが小さく、したがって使用される残留サンプルの大部分がn>0であるほぼ開ループ探索から、Lが大きく、したがって使用される全ての残留サンプルがn<0であるほぼ閉ルータ探索に漸次的に実効的に変化する。例えば、全速度で図22に与えられた符号付け方式を使用すると、ピッチサブフレームは40個のスピーチサンプルから構成され、ピッチ探索はn=−17乃至n=22と番号付けされたフォルマント残留サンプルの組を使用して始まる。n−17乃至n=−1のこの方式において、サンプルは閉ループフォルマント残留サンプルであり、一方n=0乃至n=22においてサンプルは開ループフォルマント残留サンプルである。最適ピッチ遅延を決定する時に使用される次の組のフォルマント残留サンプルは、n=−18乃至n=21と番号付けされたサンプルである。n=−18乃至n=−1において、サンプルは閉ループフォルマント残留サンプルであり、一方n=0乃至n=21においてサンプルは開ループフォルマント残留サンプルである。このプロセスは、ピッチ遅延がフォルマント残留サンプルの最後の組n=−143乃至n=−104に対して計算されるまでサンプル組を通して連続される。
【0147】
式(28)に関して上記に示されたように、その目的は、知覚加重スピーチマイナス加重フォルマントフィルタのゼロ入力応答(ZIP)であるx(n)と、Lおよびbの全ての可能な値に対するフィルタ中のメモリを与えられない、コードブックからのゼロ供給(G=0)を行われた知覚加重合成スピーチであるx´(n)との間のエラーを最小にすることである。式(28)はbに関して次のように書き直すことができる:
【数13】
Figure 2004004897
【0148】
ここにおいて、0≦n≦Lp−1に対して、
y(n)=h(n)*p(n−L)  (30)
ここでy(n)はb=1のときピッチ遅延Lを持つ加重合成スピーチであり、およびh(n)は式(3)によるフィルタ特性を有する加重フォルマント合成フィルタのインパルス応答である。
【0149】
この最小化プロセスは、値ELを最大化することに等しく、ここにおいて:
【数14】
Figure 2004004897
【0150】
であることが認められる。
【0151】
この探索は、Lの全ての許容可能な値に対して繰返される。最適bは正に限定され、したがって結果的に任意の負であるExyにより生じるLは探索において無視される。最後に、Eを最大化する遅延Lおよびピッチ遅延bが伝送のために選択される。
【0152】
上記のように、以下の式(35)乃至(38)において示された循環的な畳み込みに対して、フィルタA(z)がフィルタメモリにおいて常に0でスタートすると仮定するため、x(n)は実際に入力スピーチと加重フォルマントフィルタのZIRとの間の知覚加重された差である。しかしながら、フィルタメモリにおいて0でスタートするフィルタは実際にはない。合成において、フィルタは前のサブフレームから残っている状態を有する。実行時に、最初の状態の効果はスタート時に知覚加重スピーチから減算される。このようにして、p(n)に対して最初に全てのメモリ=0の定常状態のフィルタA(z)の応答だけが各Lに対して計算される必要があり、循環的な畳み込みが使用されることができる。x(n)のこの値はy(n)以外一度だけ計算される必要があり、ピッチフィルタの出力に対するフォルマントフィルタのゼロ状態応答は、各遅延Lに対して計算される必要がある。各y(n)の計算は、各遅延を計算される必要がない多数の冗長な乗算を含む。以下説明する循環的な畳み込みの方法は、要求される計算を最小にするために使用される。
【0153】
循環的な畳み込みに関して値y(n)は値y(n)によって定められる:
【数15】
Figure 2004004897
【0154】
が認められることができる。
【0155】
このようにして、y17(n)に対する最初の循環的な畳み込みが実行されると、要求される計算数が大幅に減少される。上記の速度1に対して与えられた例に対して、値y17(n)は番号付けされたフォルマント残留サンプルの組n=−17乃至n=22を使用して式(36)によって計算される。
【0156】
図23を参照すると、エンコーダは図12のデコーダの複製である図14,15のデコーダサブシステム235を含み、適応ポストフィルタは存在しない。図23において、ピッチ合成フィルタ550への入力はコードブック値c(n)とコードブック利得Gの積である。出力フォルマント残留サンプルp(n)は、再構成されたスピーチサンプルs´(n)としてフィルタ処理され、出力されるフォルマント合成フィルタ552に入力される。再構成されたスピーチサンプルs´(n)は、加算器554において対応した入力スピーチサンプルs(n)から減算される。サンプルs´(n)とs(n)との間の差は、知覚加重フィルタ556に入力される。ピッチ合成フィルタ550に関して、フォルマント合成フィルタ552および知覚加重フィルタ556の各フィルタは、Mpがピッチ合成フィルタ550中のメモリであり、Maがフォルマント合成フィルタ552中のメモリであり、Mwが知覚加重フィルタ556中のメモリであるフィルタ状態のメモリを含む。
【0157】
デコーダサブシステムのフォルマント合成フィルタ552からのフィルタ状態Maは、図14,15のピッチ探索サブシステム220に供給される。図24において、フィルタ状態Maは、フォルマント合成フィルタ552のZIRを計算するフィルタ560のゼロ入力応答(ZIR)を計算するために設けられる。計算されたZIR値は、加算器562において入力スピーチサンプルs(n)から減算され、結果が知覚加重フィルタ564によって加重される。知覚加重フィルタ564からの出力xp(n)は式(28)乃至(34)において加重された入力スピーチとして使用され、ここでx(n)=xp(n)である。
【0158】
図22および図23を参照すると、図22に示されているようなピッチ合成フィルタ550は、本質的に上記のように計算された開および閉ループフォルマント残留サンプルを蓄積するメモリである適応コードブック568に供給する。閉ループフォルマント残留サンプルはメモリ部分570に蓄積され、一方開ループフォルマント残留サンプルはメモリ部分572に蓄積される。サンプルは、上記の例示的な番号付け方式にしたがって蓄積される。閉ループフォルマント残留サンプルは各ピッチ遅延L探索に対する使用に関して上記のように構成される。開ループフォルマント残留サンプルは、p(n)値の計算時にデコーダサブシステムフォルマント合成フィルタ552のメモリMaを使用するフォルマント解析フィルタ574を使用して各ピッチサブフレームに対して入力スピーチサンプルs(n)から計算される。現在のピッチサブフレームに対するp(n)の値は、適応コードブック568のメモリ部分572を提供するために一連の遅延素子576を通してシフトされる。開ループフォルマント残留サンプルは、生成されて0として番号付けされ、最後の符号が142である第1の残留サンプルと共に蓄積される。
【0159】
図24を参照すると、フォルマントフィルタのインパルス応答h(n)はフィルタ566において計算され、シフトレジスタ580に出力される。フォルマントフィルタのインパルス応答h(n)に関して式(29)および(30)並びに(35)乃至(38)で上記に示されたように、これらの値はフィルタにおいて各ピッチサブフレームに対して計算される。ピッチフィルタサブシステムの計算要求をさらに減少するために、フォルマントフィルタのインパルス応答h(n)は頭部を切られて20個のサンプルにされる。
【0160】
乗算器582、加算器584およびシフトレジスタ586と共にシフトレジスタ580は、上記のようにシウトレジスタ580からの値h(n)と適応コードブック568からの値c(m)との間において循環的な畳み込みを行なうように構成されている。畳み込み動作は、ピッチ利得が1に設定されると仮定して、ピッチフィルタメモリからの入力に対するフォルマントフィルタのゼロ状態応答(ZSR)を見出すために実行される。畳み込み回路の動作において、各mに対してn個のサイクルはLpから1までであり、一方m個のサイクルは(Lp−17)−1から−143までである。レジスタ586において、データはn=1のとき進められず、n=Lpのときにはデータはラッチされない。テータは、m≦−17のときに畳み込み回路から出力として供給される。
【0161】
畳み込み回路に続いて、相関および比較回路が最適ピッチ遅延Lおよびピッチ利得bを見出すために探索を行う。2乗平均エラー(MSE)回路とも呼ばれる相関回路は、フォルマントフィルタのZIRと入力スピーチとの間の知覚加重差すなわちx(n)によりZSRの自己および交差相関を計算する。これらの値を使用して、相関回路はピッチ遅延の各値に対して最適ピッチ利得bの値を計算する。相関回路はシフトレジスタ588、乗算器590および592、加算器594および596、レジスタ598および600並びに除算器602から構成されている。相関回路において、計算はn個のサイクルがLpから1までであり、一方m個のサイクルは(Lp−17)−1から−143までであるように行われる。
【0162】
相関回路は、比較を実行し、ピッチ遅延Lおよびピッチ利得bの最適値を決定するためにデータを蓄積する比較回路によって後続される。比較回路は乗算器604、比較器606、レジスタ608,610および612並びに量子化器614から構成されている。比較回路は、合成スピーチと入力スピーチとの間のエラーを最小にするLおよびbに対する値を各ピッチサブフレームに対して出力する。bの値は、量子化器614によって8レベルに量子化され、3ビット値によって表され、付加的なレベルであるb=0レベルはL=16のときに示される。Lおよびbのこれらの値は、コードブック探索サブシステム230およびデータバッファ222に供給される。これらの値は、ピッチ探索に使用するためにデータパッキングサブシステム238またはデータバッファ222を介してデコーダ234に供給される。
【0163】
ピッチ探索と同様に、コードブック探索は、パラメータを使用して入力スピーチと合成されたスピーチとの間のエラーを最小にするパラメータを選択することによってエンコード処理が実行される合成コード処理システムによる解析である。速度1/8に対して、ピッチ利得はゼロに設定される。
【0164】
上記のように、各20m秒は上述べられたようにフレームに対して選択されたデータ速度に依存する多数のコードブックサブフレームにサブ分割される。パラメータGおよびI、コードブック利得およびインデクスは1コードブックサブフレーム当り1度それぞれ計算される。これらのパラメータの計算時、LSP周波数はピッチサブフレームLSP補間サブシステム216を参照して示されたものと同様にしてコードブックサブフレームLSP補間サブシステム226において全速度を除いてサブフレームに対して補間される。コードブックサブフレームの補間されたLSP周波数はまた各コードブックサブフレームに対してLSP・LPC変換サブシステム228によってLPC係数に変換される。コードブックサブフレームカウンタは232は、コードブックパラメータが計算されるコードブックサブフレームの追跡を維持するために使用され、カウンタの出力はコードブックサブフレームLSP補間において使用するためにコードブックサブフレームLSP補間サブシステム226に供給される。コードブックサブフレームカウンタは232はまた選択された速度に対するコードブックサブフレームの終了を表す出力をピッチサブフレームカウンタ224に供給する。
【0165】
励起コードブックは、変数でないホワイトガウスランダムシーケンスから構成された2のコードベクトルから成る。これらは、M=7に対してコードブック中の128個のエントリィがある。コードブックは、各コードベクトルが1サンプルだけ隣接したコードベクトルと異なるように循環的に構成される。すなわちコードベクトル中のサンプルは、新しいサンプルが一方の端部でシフトされ、他方の端部においてサンプルが落とされるように1位置だけシフトされる。したがって、循環的なコードブックは、2+(L−1)長である直線アレイとして蓄積されることが可能であり、ここでLCはコードブックサブフレーム長である。しかしながら、構成を簡単にし、メモリ間隔を保存するために、循環的なコードブックの2サンプル長(128個のサンプル)が使用される。
【0166】
計算を減少するために、コードブック中のガウス値は中心クリップされる。値は始めに変数1のホワイトガウスプロセスから選択される。その後、大きさが1.2より小さい任意の値がゼロに設定される。これは効果的に約75%の値をゼロに設定し、インパルスのコードブックを生成する。このコードブックの中心クリップは、ゼロによる乗算が不要であるため4の係数だけコードブック探索における循環的な畳み込みを実行するために必要される乗算数を減少する。以下、現在の動作において使用されるコードブックを表VIIIに示す。
【表8】
Figure 2004004897
【0167】
スピーチコーダは、式(3)で示された形態の加重合成フィルタを含む式(1)で示された形態の知覚雑音加重フィルタを使用する。各コードブックインデクスIに対して、スピーチは合成され、元のスピーチと比較される。エラーは、そのMSEが計算される前に知覚加重フィルタによって加重される。
【0168】
上記のように、目的はIおよびGの全ての可能な値に対するx(n)とx´(n)との間のエラーを最小にすることである。エラーの最小化は以下の式によって表されてもよい:
【数16】
Figure 2004004897
【0169】
ここにおいてLCはコードブックサブフレーム中のサンプルの数である。式(38)はGに関して書き直される:
【数17】
Figure 2004004897
【0170】
ここにおいてyは、G=1と仮定してI番目のコードベクトルを持つフォルマントフィルタのインパルス応答を回旋することによって得られる。したがって、MSEの最小化は:
【数18】
Figure 2004004897
【0171】
この探索はIの全ての許容可能な値に対して繰返される。ピッチ探索と対照的に、最適利得Gは正または負のいずれであることも可能である。最後に、Eを最大化するインデクスIおよびコードブック利得Gが伝送のために選択される。
【0172】
入力スピーチと加重ピッチおよびフォルマントフィルタのZIRとの間の知覚的に加重された差であるx(n)は、一度だけ計算される必要があることに留意しなければならない。しかしながら、各コードベクトルに対するピッチおよびフォルマントフィルタのゼロ状態応答であるy(n)は各インデクスIに対して計算される必要がある。循環的なコードブックが使用されるため、ピッチ探索に対して説明された循環的な回旋が要求される計算を最小にするために使用されることができる。
【0173】
再び図23を参照すると、エンコーダは、フィルタ状態が計算される図12のデコーダの複製の図14,15のデコーダサブシステム235を含み、ここにおいてMpはピッチ合成フィルタ550中のメモリであり、Maはフォルマント合成フィルタ552中のメモリであり、Mwは知覚加重フィルタ556中のメモリであるデコーダサブシステムのピッチおよびフォルマント合成フィルタ550および552(図23)からの各フィルタ状態MpおよびMaは、図14,15のコードブック探索サブシステム230に供給される。図25において、フィルタ状態MpおよびMaは、ピッチおよびフォルマント合成フィルタ550および552のZIRを計算するゼロインパルス応答(ZIR)フィルタ620に供給される。ピッチおよびフォルマント合成フィルタの計算されたZIRは加算器622において入力スピーチサンプルs(n)から減算され、結果が知覚加重フィルタ624によって加重される。知覚加重フィルタ564からの出力x(n)は上記のMSE式(39)乃至(44)において加重入力スピーチとして使用され、ここでx(n)=x(n)である。
【0174】
図25において、フォルマントフィルタのインパルス応答h(n)はフィルタ626において計算され、シフトレジスタ628に出力される。フォルマントフィルタ応答のインパルス応答h(n)は、各コードブックサブフレームに対して計算される。計算要求をさらに減少するために、フォルマントフィルタのインパルス応答h(n)は頭部を切られて20個のサンプルにされる。
【0175】
乗算器630、加算器632およびシフトレジスタ634と共にシフトレジスタ628は、シフトレジスタ628からの値h(n)と上記のようにコードブックベクトルを含むコードブック636からの値c(m)との間において循環的な回旋を実行するように構成されている。この回旋動作は、コードブック利得が1に設定されると仮定して、各コードベクトルのフォルマントフィルタのゼロ状態応答(ZSR)を見出すために実行される。回旋回路の動作において、各mに対してn個のサイクルはLCから1までであり、一方m個のサイクルは 1から256までである。レジスタ586において、データはn=1のとき進められず、n=LCのときデータはラッチされない。テータは、m≦1のときに回旋回路から出力として供給される。したがって、回旋回路に後続する相関および比較回路をスタートする前に、回旋回路はm個のサブフレーム寸法時間を循環することによって循環的な回旋動作を導くために初期化されなければならないことに留意すべきである。
【0176】
相関および比較回路は、コードブックインデクスIおよびコードブック利得Gの値を生成するように実際のコードブック探索を導く。2乗平均エラー(MSE)回路とも呼ばれる相関回路は、ピッチおよびフォルマントフィルタのZIRと入力スピーチx´(n)との間の知覚加重された差によりZSRの自己および交差相関を計算する。換言すると、相関回路はコードブックインデクスIの各値に対してコードブック利得Gの値を計算する。相関回路はシフトレジスタ638、乗算回路640および642、加算器644および646、レジスタ648および650並びに除算器652から構成されている。相関回路において、計算はn個のサイクルはLCから1までであり、一方m個のサイクルは1乃至256までであるように行われる。
【0177】
相関回路は、コードブックインデクスIおよび利得Gの最適値を決定するために比較およびデータの蓄積を実行する比較回路によって後続される。比較回路は、乗算器654、比較器656、レジスタ658,660および662並びに量子化器664から構成されている。比較回路は、合成スピーチと入力スピーチとの間のエラーを最小にするIおよびGに対する値を各コードブックサブフレームに供給する。コードブック利得Gは、図20を参照して示されたようにバイアスの除去されたLSP周波数量子化およびコード処理と同様にしてDPCMが量子化中に値をコード化する量子化器614において量子化される。その後、IおよびGに対するこれらの値はデータバッファ222に供給される。
【0178】
コードブック利得Gの量子化およびDPCMエンコード処理は、以下の式にしたがって計算される:
【数19】
Figure 2004004897
【0179】
ここにおいて、20logGi−1および20logGi−2は直前のフレーム(i−1)および直前のフレームに先行するフレーム(i−2)に対して計算された各値である。
【0180】
速度と共にLSP、I、G、Lおよびbの値は、データが伝送のために配列されるデータパッキングサブシステム236に供給される。1つの構成において、速度と共にLSP、I、G、Lおよびbの値は、データパッキングサブシステム236を介してデコーダ234に供給される。別の構成において、これらの値はピッチ探索において使用するためにデータバッファ222を介してデコーダ234に供給される。しかしながら、好ましい実施例において、コードブック符号ビットの保護はコードブックインデクスに影響を与えるデータパッキングサブシステム236内において使用される。したがって、この保護は、IおよびGデータがデータバッファ222から直接供給された場合を考慮しなければならない。
【0181】
データパッキングサブシステム236において、データは伝送のために種々のフォルマントにしたがってパックされる。図26は、データパッキングサブシステム236の機能素子の一実施例を示す。データパッキングサブシステム236は、疑似ランダム発生器(PN)670、サイクル冗長検査(CRC)計算素子672、データ保護論理回路674およびデータ結合器676から構成されている。PN発生器670は速度情報を受信し、1/8速度に対してデータ結合器676に供給される4ビットランダム数を発生する。CRC素子672は、速度と共にコードブック利得およびLSP値を受信し、全速度に対してデータ結合器676に供給される11ビットの内部CRCコードを発生する。
【0182】
データ結合器676は速度と共にランダム数、CRCコードを受信し、データバッファ222からのLSP,I,G,Lおよびbの値(図15)は伝送チャンネルデータプロセッササブシステム234に出力を供給する。データが最小でデータバッファ222からデコーダ234に直接供給される構造において、PN発生器の4ビット数はPN発生器670からデータ結合器676を介してデコーダ234に供給される。全速度において、CRCビットはデータ結合器674からの出力としてフレームデータと共に含まれ、一方1/8速度においてコードブックインデクスの値は落とされ、ランダム4ビット数によって置換される。
【0183】
実施例において、コードブック利得符号ビットに対して保護が与えられることが好ましい。このビットの保護は、このビット中の単一のビットエラーに対するベクトルデコーダの感度を低くすることである。符号ビットが検出されないエラーのために変化された場合、コードブックインデクスは最適に関連していないベクトルを示す。保護なしのエラー状況において、最適ベクトルの負のものが選択され、このベクトルは本質的に使用される最悪の可能なベクトルである。ここにおいて使用される保護方式は、利得符号ビット中の単一のビットエラーが最適ベクトルの負のものをエラー状況において選択させないことを保証する。データ保護論理回路674はコードブックインデクスおよび利得を受信し、利得値の符号ビットを試験する。利得値符号ビットが負であると決定された場合、値89は関連したコードブックインデクスにモード128で加算される。修正された、または修正されないコードブックインデクスは、データ保護論理回路674からデータ結合器676に出力される。
【0184】
実施例において、全速度で圧縮された音声パケットデータの最も知覚的に感度の高いビットは、内部CRC(サイクル冗長検査)等によって保護されることが好ましい。11個の余分なビットは、保護されたブロック中の任意の単一のエラーを補正することができるこのエラー検出および補正機能を実行するために使用される。保護されたブロックは、10個のLSP周波数の最大桁ビットおよび8個のコードブック利得値の最大桁ビットから構成されている。補正不可能なエラーがこのブロックにおいて発生した場合、パケットは廃棄され、以下説明されるような削除が通知される。そうでなければ、ピッチ利得はゼロに設定されるが、しかし残りのパラメータは受信されたときに使用される。実施例において、サイクルコードは(31,21)サイクルコードを生じる発生器多項式を有するように選択される:
【数20】
Figure 2004004897
【0185】
しかしながら、別の発生器多項式が使用されてもよいことを理解しなければならない。全体的なパリティビットは、それを(32,21)コードにするように添付される。18情報ビットだけが存在しているため、コードワード中の最初の3デジットはゼロに設定され、伝送されない。この技術は、シンドロームがこれらの位置においてエラーを示した場合、それが補正不可能なエラーがあることを意味するように付加的な保護を提供する。システム形態のサイクルコードのエンコード処理は、×10u(x)モジュロg(x)としてパリティビットの計算を含み、ここでu(x)はメッセージ多項式である。
【0186】
デコード処理終了時に、シンドロームは受信されたベクトルのg(x)による除算から余りとして計算される。シンドロームがエラーを示さない場合、パケットは全体的なパリティビットの状態にかかわらず受容される。シンドロームが単一のエラーを示した場合、エラーは全体的なパリティビットの状態が検査しない場合に補正される。シンドロームが1以上のエラーを示した場合、パケットは廃棄される。このようなエラー保護方式に関する詳細は、シンドローム計算の詳細に対するLinおよびCostello氏による文献(“Error Con−trol coding:Fundamentals and Applications”)において認められることができる。
【0187】
CDMAセル電話機システムにおいて、データは20m秒のデータ伝送フレームでの伝送用のデータパッキングのためにデータ結合器674から伝送チャンネルデータプロセッササブシステム238に供給される。ボコーダが全速度に対して設定される伝送フレームにおいて、192ビットは 9.6kbpsの実効ビット速度に対して伝送される。この場合の伝送フレームは、混合フレームタイプ(0=音声のみ,1=音声およびデータ/信号送信)を示すために使用される1つの混合モードビット、11内部CRCビットと共に160のボコーダデータビット、12外部またはフレームCRCビットおよび8テールまたはフラッシュビットから構成されている。1/2速度において、80のボコーダデータビットは、 4.8kbpsの実効ビット速度に対して8フレームCRCビットおよび8テールビットと共に伝送される。1/4速度において、40のボコーダデータビットは、 2.4kbpsの実効ビット速度に対して8テールビットと共に伝送される。最後に、1/8速度に対して16のボコーダデータビットは、 1.2kbpsの実効ビット速度に対して8テールビットと共に伝送される。
【0188】
本発明のボコーダが使用されるCDMAシステムにおいて使用された変調に関する詳細は、本出願人の別出願の米国特許出願07/543,496号明細書(1990年 6月25日出願,“SYSTEM AND METHOD FOR GENERATING SIGNAL WAVEFORMS IN A CDMACELLULAR TELEPHONE SYSTEM”)に記載されている。このシステムにおいて、全速度以外の速度でデータビットが20m秒のデータ伝送フレーム内に疑似ランダム的に位置されたビットグループを持つグループに組織化される方式が使用される。別のフレーム速度およびビット表記は、ここにおいて説明のためにボコーダおよびCDMAシステム構造に関して示されたもの以外に容易に使用されてもよいため、別の構造がボコーダおよびその他のシステム適用に利用できることが理解されるべきである。
【0189】
CDMAシステムおよび別のシステムにも適用可能なフレーム単位ベースのプロセッササブシステム238は、信号送信データまたはその他の非スピーチ情報データ等の別のデータを伝送するためにボコーダデータの伝送を中断する可能性がある。この特定のタイプの伝送状況は“ブランクおよびバースト”と呼ばれる。プロセッササブシステム238は、本質的にフレームに対して所望の伝送データとボコーダデータを置換する。
【0190】
同じデータ伝送フレーム中にボコーダデータおよび別の伝送データの両方を伝送することが所望される別の状況が生じる。この特定のタイプの伝送状況は、“ディムおよびバースト”と呼ばれる。“ディムおよびバースト”伝送において、ボコーダは1/2速度のような所望の速度でボコーダ最終速度を設定する速度制限命令を与えられる。1/2速度のエンコーダボコーダデータは、データ伝送フレーム用のボコーダデータと共に付加的なデータを挿入するプロセッササブシステム238に供給される。
【0191】
全二重電話機リンクに与えられる付加的な機能は速度インターロックである。1つの方向のリンクが最高伝送速度で伝送している場合、別の方向のリンクは強制的に最低速度で伝送させられる。最低速度でも、話し手が中断されていると実感して話しを止めるのに十分な理解度が活動的な話し手に対して有効であり、それによって別の方向のリンクに活動的な話し手の役割を行なわせる。さらに、活動的な話し手が試みられた中断にかかわらず話を続ける場合、話し手自身のスピーチが品質を知覚する能力を“妨害する”ため、彼は恐らく品質の劣化を知覚しない。速度制限命令を使用することによって、ボコーダは通常の速度より低い速度でスピーチをボコード処理するように設定されることができる。
【0192】
速度制限命令は、CDMAシステム中の付加的な容量が必要とされたとき、全速度より低いボコーダ最大速度を設定するために使用されることができることを理解すべきである。共通の周波数スペクトルが伝送に使用されるCDMAシステムにおいて、1つの利用者信号はシステム中に別の利用者信号に対する干渉として現れる。したがって、システム利用者容量はシステム利用者によって生じた全体的な干渉によって制限される。通常システム内における利用者の増加のために干渉のレベルが増加すると、品質の劣化は干渉の増加のために利用者によって経験される。
【0193】
各利用者のCDMAシステム中の干渉に対する影響は、利用者伝送データ速度の関数である。通常の速度より低い速度でスピーチをエンコード処理するようにボコーダを設定することによって、エンコード処理されたデータは対応した減少した伝送データ速度で伝送され、その利用者によって発生させられた干渉のレベルを低下させる。したがって、システム容量は低速度でスピーチをボコード処理することによって実質的に増加される。システム要求が増加すると、利用者ボコーダはシステム制御装置またはセルベースステーションによってエンコード処理速度を低下するように命令される。本発明のボコーダは、全速度および1/2速度でエンコード処理されたスピーチ間の知覚可能な差があっても、非常に小さい品質のものである。したがって、スピーチが1/2速度のような低速度でボコード処理されるシステム利用者間の通信の品質における影響は、システムにおける利用者数の増加により生じた干渉のレベルの増加によって生じたものより重要ではない。
【0194】
したがって、通常のボコード処理速度より低い速度に対して個々のボコーダ速度制限を設定する種々の方式が使用されてもよい。例えば、セル中の全ての利用者は1/2速度でスピーチをエンコード処理するように命令されてもよい。このような動作は利用者間の通信の品質に対してほとんど影響を与えずに実質的にシステム干渉を減少し、一方付加的な利用者に対して容量を実質的に増加する。システムにおける全体的な干渉は付加的な利用者によって劣化のレベルに増加されるまで、利用者間の通信の品質における影響はない。
【0195】
上記のように、エンコーダはスピーチサンプルのフレームをエンコード処理する時に解析・合成技術を行なうためにデコーダの複製を含む。図14,15に示されているように、デコーダ234はいるスピーチとの比較のために合成されたスピーチを再構成するためにデータパッキングサブシステム238またはデータバッファ222のいずれを介して値L,b,lおよびIを受信する。デコーダからの出力は上記のように値Mp,MaおよびMwである。エンコーダにおいて、および伝送チャンネルの別の端部で合成されたスピーチを再構成する時に使用されるようなデコーダ234に関する詳細は、図27乃至図37を参照して説明される。
【0196】
図27は、本発明のデコーダの一実施例のフロー図である。エンコーダ内および受信機において構成されているようなデコーダの共通の構造のために、これらの構造は一緒に説明する。図27に関する説明は、そこで受信されたデータがデコーダにおいて予め処理されなければならず、またエンコーダのデコーダにおいて適切なデータ(速度,I,G,Lおよびb)がデータパッキングサブシステム238またはデータバッファ222から直接受信されるため、主に伝送チャンネルの端部におけるデコーダに関連している。しかしながら、デコーダの基本的な機能はエンコーダおよびデコーダ動作に対して同じである。
【0197】
図12を参照して説明されたように、各コードブックサブフレームに対してコードブックインデクスIによって定められたコードブックベクトルは、蓄積されたコードブックから検索される。ベクトルはコードブック利得Gによって乗算され、その後フォルマント残留を生成するように各ピッチサブフレーム用のピッチフィルタによってフィルタ処理される。このフォルマント残留はフォルマントフィルタによってフィルタ処理され、その後出力スピーチ信号を生成するために自動利得制御装置(AGC)と共に適用フォルマントポストフィルタおよび輝度ポストフィルタを通過させられる。
【0198】
コードブックおよびピッチサブフレームの長さは変化するが、デコード処理は実行を容易にするためにの40個のサンプルブロックで実行される。受信された圧縮データは、最初にコードブック利得、コードブックインデクス、ピッチ利得、ピッチ遅延およびLSP周波数にパック解除される。LSP周波数は、図35を参照して説明されるようにそれらの各反転量子化器およびDPCMデコーダを通して処理されなければならない。同様に、コードブック利得値はバイアスアスペクトがないことを除いてLSP周波数と同じ方法で処理されなければならない。また、ピッチ利得値は反転量子化される。その後、これらのパラメータは各デコード処理サブフレームに与えられる。各デコード処理サブフレームにおいて、2組のコードブックパラメータ(G&I)、1組のピッチパラメータ(b&L)および1組のLPC係数が40個の出力サンプルを生成するために必要とされる。図28,29,30,31および32,33,34は種々の速度および別のフレーム条件に対する例示的なサブフレームデコード処理パラメータを示す。
【0199】
全速度フレームに対して、8組の受信されたコードブックパラメータおよび4組の受信されたピッチパラメータが存在する。LSP周波数は、4組のLSP周波数を生成するために4度補間される。受信されたパラメータおよび対応したサブフレーム情報は図28に示されている。
【0200】
1/2速度フレームに対して、各組の4つの受信コードブックパラメータは一度反復され、各組の2つの受信ピッチパラメータは一度反復される。LSP周波数は、4組のLSP周波数を生成するために3度補間される。受信されたパラメータおよび対応したサブフレーム情報は図29に示されている。
【0201】
1/4速度フレームに対して、各組の2つの受信コードブックパラメータは4度反復され、ピッチパラメータの組はまた4度反復される。LSP周波数は2組のLSP周波数を生成するために一度補間される。受信されたパラメータおよび対応したサブフレーム情報は図30に示されている。
【0202】
1/8速度フレームに対して、受信コードブックパラメータの組はフレーム全体に対して使用される。ピッチパラメータは1/8速度フレームに対して存在せず、ピッチ利得は単にゼロに設定される。LSP周波数は1組のLSP周波数を生成するために一度補間される。受信されたパラメータおよび対応したサブフレーム情報は図31に示されている。
【0203】
音声パケットは、CDMAセルまたは自動車ステーションが信号情報を伝送するためにためにしばしば無効にされる。ボコーダが無効フレームを受信したとき、それは前のフレームのパラメータを少し修正して連続する。コードブック利得はゼロに設定される。前のフレームのピッチ遅延および利得は、利得が1以下に限定されることを除いて現在のフレームピッチ遅延および利得として使用される。前のフレームのLSP周波数は、補間のないものとして使用される。エンコード端およびデコード端は依然として同期され、ボコーダは無効フレームから非常に速く回復できることに留意されたい。受信されたパラメータおよび対応したサブフレーム情報は図32に示されている。
【0204】
フレームがチャンネルエラーのために失われた場合、ボコーダは前のフレームのエネルギの一部分を維持し、背景雑音に滑らかに転移することによってこのエラーをマスクすることを試みる。この場合、ピッチ利得はゼロに設定される。ランダムコードブックは前のサブフレームのコードブックインデクスプラス89を使用することによって選択される。コードブック利得は前のサブフレームのコードブック利得の0.7倍である。数89に関して特別なことは何もなく、これは疑似ランダムコードブックベクトルを選択する単なる便利な方法である。前のフレームの
ω= 0.9(前のω−ωのバイアス値+ωのバイアス値)
に向かって強制的に減衰させられる。LSP周波数バイアス値は表5に示されている。受信されたパラメータおよび対応したサブフレーム情報は図33に示されている。
【0205】
速度は受信機において決定されることができない場合、パケットは廃棄され、削除が通知される。しかしながら、受信機が決定する場合、エラーに関して以下のことが実行されるが、フレームは全速度で伝送された可能性が強い。上記に説明されたように全速度において、圧縮された音声パケットデータの最も知覚的に感度の高いビットは、内部CRCによって保護される。デコード端において、シンドロームは受信されたベクトルをg(x)で除算した余りとして式(46)から計算される。シンドロームが無エラーを示した場合、パケットは全体的なパリティビットの状態に関係なく受容される。シンドロームが単一エラーを示した場合、エラーは全体的なパリティビットの状態が検査しない場合に補正される。シンドロームが1以上のエラーを示した場合、パケットは廃棄される。補正不可能なエラーがこのブロック中で発生した場合、パケットは廃棄され、削除が通知される。そうでなければ、図34に示されているように、ピッチ利得はゼロに設定されるが、しかし残りのパラメータは補正されて受信されたときに使用される。
【0206】
この構造において使用されたポストフィルタは最初にJ.H.Chen氏他による文献(“Real−Time Vector APC Speech Coding At 4800 BPS with Adaptive postfiltering”,Proc.ICASSP,1987年)において説明された。スピーチフォルマントはスペクトルの谷より知覚的に重要であるため、ポストフィルタはコード化されたスピーチの知覚的品質を改良するためにフォルマントを少し支援する。これは、フォルマント合成フィルタの極を原点に向って半径方向にスケール処理することによって実行される。しかしながら、全極ポストフィルタは一般に結果的にフィルタ処理されたスピーチの消音を生じさせるスペクトル傾斜を導入する。この全極ポストフィルタのスペクトル傾斜は、極と同じ位相角度を有するが、半径が小さいゼロを付加し、結果的に形態:
H(z)=A(z/ρ)/A(z/σ)
0<ρ<σ<1(48)
のポストフィルタを生じさせることによって減少される。ここにおいて、A(z)はフォルマント予測フィルタであり、値ρおよびσはポストフィルタスケール処理係数であり、ここにおいてρは0.5に設定され、σは0.8に設定される。
【0207】
適応輝度フィルタは、フォルマントポストフィルタによって導入されたスペクトル傾斜をさらに補償するために付加される。輝度フィルタは形態:
B(z)=(1−κz−1)/(1+κz−1)(49)
であり、ここにおいてκ(この1タップフィルタの係数)の値はA(z)のスペクトル傾斜の変化を近似するLSP周波数の平均値によって決定される。
【0208】
ポストフィルタ処理の結果生じる任意の大きい利得変動を避けるために、AGCループはそれが非ポストフィルタ処理されたスピーチとほぼ同じエネルギを有するようにスピーチ出力をスケール処理するように構成されている。利得制御は、反転フィルタ利得を得るために40個のフィルタ出力サンプルの2乗の和で40個のフィルタ入力サンプルの2乗の和を除算することによって実行される。その後、この利得係数の平方根は滑らかにされる:
滑らかなβ=0.2現在のβ+0.98前のβ   (50)
また、フィルタ出力は出力スピーチを生成するようにこの滑らかな反転利得と乗算される。
【0209】
図27において、データと共に伝送された、或いは別の手段によって導出された速度と共にチャンネルからのデータは、データパック解除サブシステム700に供給される。CDMAシステムに対する一実施例において、速度決定は、それが各異なる速度でデコード処理されたときに受信されたデータであるエラー速度から導出されることができる。データアンパックサブシステム700において、全速度でCRCの検査がエラーに対して行われ、この検査の結果がサブフレームデータアンパックサブシステム702に供給される。サブシステム700は、有効なデータを持つ無効フレーム、削除フレームまたはエラーフレーム等の異常フレーム状態の指示をサブシステム702に与える。サブシステム700はフレームに対するパラメータI,G,Lおよびbと共に速度をサブシステム702に与える。コードブックインデクスIおよび利得Gの供給時に、利得値の符号ビットはサブシステム702において検査される。符号ビットが負である場合、値89はモード128で関連したコードブックインデクスから減算される。さらに、サブシステムにおいてコードブック利得は反転量子化され、DPCMデコード処理され、一方ピッチ利得が反転量子化される。
【0210】
サブシステム700はまたLSP反転量子化/補間サブシステム704に速度およびLSP周波数を供給する。サブシステム700は、さらに有効なデータを持つブランクフレーム、削除フレームまたはエラーフレームの指示をサブシステム704に与える。デコードサブフレームカウンタ706はサブフレームカウント値iおよびjの指示を両サブシステム702および704に与える。
【0211】
サブシステム704において、LSP周波数は反転量子化され、補間される。図35は、サブシステム704の反転量子化部分の構造を示し、一方補間部分は実質的に図20を参照して説明されたものと同じである。図35において、サブシステム704の反転量子化部分は、図20の反転量子化器468と同一に構成され、同様に動作する反転量子化器750から構成されている。反転量子化器750の出力は乗算器754の出力として供給される。加算器752の出力は、蓄積されて乗算器754における定数0.9との乗算のために出力されるレジスタ756に供給される。加算器752の出力はまたバイアス値がLSP周波数に加算される加算器758に供給される。LSP周波数の順序は、LSP周波数を強制的に最小に分離させる論理回路760によって保証される。一般に、エラーが伝送時に発生しなければ、分離を強制する必要性が生じない。LSP周波数は、図21、図28乃至31および図32乃至34を参照して説明されたように補間される。
【0212】
図27を参照すると、メモリ708は前のフレームLSP,ωi,f−1を蓄積するためサブシステム704に結合され、またバイアス値bωを蓄積するために使用されてもよい。これらの前のフレーム値は、全ての速度に対する補間時に使用される。有効なデータを持つブランク、削除またはエラーフレームの状態に対して、前のフレームLSPωi,f−1は図32乃至34のチャートにしたがって使用される。サブシステム700からのブランクフレーム指示に応答して、サブシステム704は現在のフレームにおいて使用するためにメモリ708に蓄積された前のフレームのLSP周波数を検索する。削除フレーム指示に応答して、サブシステム704は上記のように現在のフレームのLSP周波数を計算するようにバイアス値と共にメモリ708からの前のフレームのLSP周波数を検索する。この計算の実行時に、蓄積されたバイアス値は加算器において前のフレームのLSP周波数から減算され、結果が乗算器において0.9の定数により乗算され、この結果が加算器において蓄積されたバイアス値に加算される。有用なデータ指示を持つエラーフレームに応答して、LSP周波数はCRCが成功した場合に全速度に対して行われたように補間される。
【0213】
LSPは、LSP周波数がLPC値に変換されるLSP・LPC変換サブシステム710に供給される。サブシステム710は、図21を参照して説明された図14,15のLSP・LPC変換サブシステム218および228と実質的に同じである。その後、LPC係数αはフォルマントフィルタ714およびフォルマントポストフィルタ716の両方に供給される。LSP周波数はまたLSP平均サブシステム712中のサブフレームに対して平均され、適応輝度フィルタ718に値κとして供給される。
【0214】
サブシステム702は、速度および異常フレーム状態指示と共にサブシステム700からフレームに対するパラメータI,G,Lおよびbを受信する。サブシステム702はまたサブフレームカウンタ706から各デコードサブフレーム1乃至4中の各iカウントに対するjカウントを受信する。サブシステム702はまた異常フレーム状態で使用するためにG,I,Lおよびbに対して前のフレーム値を蓄積するメモリ720に結合される。1/8速度以外の通常フレーム状態下のサブシステム702は、図28乃至31にしたがってコードブック722にコードブックインデクス値Iを供給し、乗算器724にコードブック利得値Gを供給し、またピッチフィルタ726にピッチ遅延Lおよび利得b値を供給する。1/8速度に対して、送信されるコードブックインデクスに対する値がないため、1/8速度に対して16ビットパラメータ値(図31)であるパケットシードは、速度指示と共にコードブック722に供給される。異常フレーム状態に対して、値は図32乃至34にしたがってサブシステム702から供給される。さらに1/8速度に対して、図36を参照して説明されるようにコードブック722に指示が与えられる。
【0215】
サブシステム700からのブランクフレーム指示に応答して、サブシステム702は、利得が1以下に制限され、現在のフレームデコードサブフレームにおいて使用するために蓄積されることを除いて、前のフレームピッチ遅延Lおよび利得bを検索する。さらに、コードブックインデクスIは供給されず、コードブック利得Gはゼロに設定される。削除フレーム指示に応答して、サブシステム702はメモリ720からの前のフレームのサブフレームコードブックインデクスを検索し、加算器において89の値を加算する。前のフレームのサブフレームコードブック利得は、Gの各サブフレーム値を生成するように乗算器において0.7の定数により乗算される。ピッチ遅延値は供給されず、一方ピッチ利得はゼロに設定される。有用データ指示を持つエラーフレームに応答して、コードブックインデクスおよび利得は、CRCが成功した場合に全速度フレームにおける場合のように使用され、一方ピッチ遅延値は供給され、ピッチ利得はゼロに設定される。
【0216】
解析・合成技術におけるエンコーダ・デコーダを参照して説明されたように、コードブックインデクスIは乗算器724への出力のためにコードブック値に対する開始アドレスとして使用される。コードブック利得値はコードブック722からの出力値と乗算器724において乗算され、その結果はピッチフィルタ726に供給される。ピッチフィルタ726は、フォルマントフィルタ714に出力されるフォルマント残留を生成するために入力ピッチ遅延Lおよび利得b値を使用する。フォルマントフィルタ714において、LPC係数はスピーチを再構成するようにフォルマント残留をフィルタ処理する時に使用される。受信機デコーダにおいて、再構成スピーチはさらにフォルマントポストフィルタ716および適応輝度フィルタ718によってフィルタ処理される。AGCループ728はフォルマントフィルタ714およびフォルマントポストフィルタ716の出力において使用され、その出力は適応輝度フィルタ718の出力と乗算器730において乗算される。乗算器730の出力は、既知の技術を使用してアナログ形態に変換され、聞き手に提供される再構成されたスピーチである。エンコーダのデコーダにおいて、そのメモリを更新するために出力に知覚加重フィルタが配置されている。
【0217】
図35を参照すると、デコーダ自身の構造の詳細が示されている。図36において、コードブック722は、図25を参照して説明されたものと同じメモリ750から構成されている。しかしながら、説明のためにメモリ750に対して少し異なる方法が示され、図36にはそのアドレス処理が示されている。コードブック722はさらにスイッチ752,マルチプレクサ753および疑似ランダム数(PN)発生器754から構成されている。スイッチ752は、図25を参照して説明されたようにメモリ750のインデクスアドレス位置を示すコードブックインデクスに応答する。メモリ750は、出力のためにメモリを通してシフトされた値で開始メモリ位置を示すスイッチ752を備えた回路メモリである。コードブック値は、マルチプレクサ753への1入力としてメモリ750からスイッチ752を通って出力される。マルチプレクサ753は、コードブック利得増幅器、乗算器724にスイッチ752を通って供給された値の出力を供給するために全、1/2および1/4の速度に応答する。マルチプレクサ753はまたコードブック722の乗算器724への出力に対してPN発生器754の出力を選択するために1/8速度指示に応答する。
【0218】
CELPコード処理の高い音声品質を維持するために、エンコーダおよびデコーダはそれらの内部フィルタメモリに蓄積された同じ値を有していなければならない。これは、デコーダおよびエンコーダのフィルタが同じシーケンスの値によって励起されるようにコードブックインデクスを伝送することによって行われる。しかしながら、高いスピーチ品質に対して、これらのシーケンスはそれらの中に分布されたいくつかのスパイクを持つほぼゼロから構成される。このタイプの励起は、背景雑音をコード処理するのに最適ではない。
【0219】
最低のデータ速度で実行される背景雑音のコード処理時に、疑似ランダムシーケンスはフィルタを励起するように構成されてもよい。フィルタメモリがエンコーダおよびデコーダにおいて同じであることを保証するために、2つの疑似ランダムシーケンスは同じでなければならない。シードは受信機デコーダに何とか伝送されなければならない。シードを送信するために使用されることができる付加的なビットは存在しないため、伝送されたパケットビットは、数を形成するかのようにシードとして使用されることができる。この技術は、低速度でコードブック利得およびインデクスを決定するために全く同じCELP解析・合成構造が使用されるため実行されることができる。相違は、コードブックインデクスが廃棄され、その代わりにエンコーダフィルタメモリが疑似ランダムシーケンスを使用して更新されることである。したがって、励起用のシードは解析が行われた後、決定されることができる。パケット自身が1組のビットパターンの間で周期的にサイクル化しないことを保証するために、4ランダムビットはコードブックインデクス値の代わりに1/8速度のパケットに挿入される。したがって、パケットシードは図17に示されたように16ビット値である。
【0220】
PN発生器754は、良く知られた技術を使用して構成され、種々のアルゴリズムによって実行されてもよい。実施例において、使用されたアルゴリズムは、PaulMennen氏による文献(“DPS chip can produce random numbers using proven algorithm”,EDN,1991年 1月21日)において説明された性質のものである。伝送されたビットパケットは、シーケンスを生成するためにシード(図27のサブシステム700から)として使用される。1構造において、シードは値521により乗算され、それに値259を加算される。この結果的な値から、最小桁ビットが符号を付けられた16ビット数として使用される。その後、この値は次のコードブック値を生成する時にシードとして使用される。PN発生器によって生成されたシーケンスは、1の変数を有するように定常化される。
【0221】
コードブック722から出力された各値は、デコードサブフレーム中に供給されるとコードブック利得Gにより乗算器724において乗算される。この値はピッチフィルタ726の加算器756への1入力として供給される。ピッチフィルタ726はさらに乗算器758およびメモリ760から構成されている。ピッチ遅延Lは、乗算器758に出力されるメモリ760の分岐の位置を決定する。メモリ760の出力はピッチ利得値bと乗算器758において乗算され、その結果が加算器756に出力される。加算器756の出力は、シフトレジスタのような一連の遅延素子であるメモリ760の入力に供給される。値はメモリ760を通してシフトされ(矢印によって示されているような方向に)、選択された分岐出力においてLの値によって決定されたように供給される。値はメモリ760を通してシフトされるため、143シフトより古い値は廃棄される。加算器756の出力はまたフォルマントフィルタ714に入力として供給される。
【0222】
加算器756の出力はフォルマントフィルタ714の加算器762の1入力に供給される。フォルマントフィルタ714はさらに乗算器764a乃至764jおよびメモリ766のバンクから構成されている。加算器762の出力は、シフトレジスタのような一連の分岐された遅延素子として構成されたメモリ766への入力として供給される。値はメモリ766を通してシフトされ(矢印によって示されているような方向に)、端部において廃棄される。各素子は、乗算器764a乃至764jの対応したものへの出力としてそこに蓄積された値を供給する分岐を有する。乗算器764a乃至764jはまたそれぞれメモリ766からの出力との乗算のために各LPC係数α1乃至α10を受取る。加算器762からの出力は、フォルマントフィルタ714の出力として供給される。
【0223】
フォルマントフィルタ714の出力は、フォルマントポストフィルタ716およびAGCサブシステム728への入力として供給される。フォルマントポストフィルタ716は、メモリ772並びに乗算器774a乃至774j;776a乃至776jおよび782a乃至782jと共に加算器768および770から構成されている。値がメモリ772を通してシフトされると、それらは加算器768および770における和に対してスケール処理されたLPC係数値との乗算のために対応した分岐において出力される。フォルマントポストフィルタ716からの出力は、適応輝度フィルタ718への入力として供給される。
【0224】
適応輝度フィルタ718は、加算器784および786、レジスタ788および790並びに乗算器792および794から構成されている。図37は、適応輝度フィルタの特性を示したチャートである。フォルマントポストフィルタ716の出力は加算器784に1入力として供給され、一方別の入力は乗算器792の出力から供給される。加算器784の出力はレジスタ788に供給され、1サイクルの間蓄積され、次のサイクル中に図27のLSP平均サブシステム712から供給された値−κと共に乗算器792および794に出力される。乗算器792および794からの両出力は、加算器784および786に供給される。加算器786からの出力はAGCサブシステム728およびシフトレジスタ790に供給される。シフトレジスタ790は、フォルマントフィルタ714からAGCサブシステム728へおよびフォルマントポストフィルタ716を介して適応輝度フィルタ718に供給されたデータ出力の調整を保証するために遅延ラインとして使用される。
【0225】
AGCサブシステム728は、フォルマントポストフィルタ716および適応輝度フィルタ718へのスピーチ入力エネルギに関してスピーチ出力エネルギをスケール処理するようにフォルマントポストフィルタ716および適応輝度フィルタ718からデータを受信する。AGCサブシステム728は乗算器798,800,802および804;加算器806,808および810;レジスタ812,814および816;除算器818並びに平方根素子820から構成されている。フォルマントポストフィルタ716から出力された40サンプルは、値“x”を生成するように乗算器798において2乗され、加算器806およびレジスタ812から構成された累算器において合計される。同様に、レジスタ790の前に行われる、適応輝度フィルタ718から出力された40サンプルは値“y”を生成するように乗算器800において2乗され、加算器808およびレジスタ814から構成された累算器において合計される。値“y”は、除算器816において値“x”によって除算され、結果的にフィルタの反転利得を生じさせる。反転利得係数の平方根は素子818において取られ、その結果が平滑にされる。平滑動作は、乗算器802において定数値0.02により現在の値利得を乗算することによって行なわれ、この結果はレジスタ820および乗算器804を使用して計算されたときに前の利得の0.98倍の結果に加算器810で加算される。その後、フィルタ718の出力は出力再構成スピーチを提供するように乗算器730において平滑にされた反転利得と乗算される。出力スピーチは、利用者に出力するために種々の良く知られた変換技術を使用してアナログ形態に変換される。
【0226】
ここに示された本発明の実施例は単なる一例に過ぎず、機能的に等価である実施例の変更が行なわれてもよいことを理解すべきである。本発明は、スピーチサンプルをエンコードし、エンコードされたスピーチをデコードするためにここに示されているような機能動作を提供するように適切なプログラム制御下においてデジタル信号プロセッサで実行されてもよい。別の態様において、本発明は良く知られた非常に大きいスケールインテグレーション(VLSI)技術を使用する適用限定集積回路(ASIC)に内蔵されてもよい。
【0227】
上記の好ましい実施例の説明は、当業者が本発明を形成または使用できるように与えられている。当業者はこれらの実施例に対する種々の修正を容易に認識し、ここに限定された一般的な原理は発明能力を必要とせずに別の実施例に対して適用されてもよい。以上、本発明はここに示された実施例に限定されるものではなく、ここに記載された原理および新しい特徴と適合した非常に広い技術的範囲が提供される。
【図面の簡単な説明】
【図1】種々の速度に対するボコーダ解析フレームおよびサブフレームをグラフで示す。
【図2】種々の速度に対するボコーダ解析フレームおよびサブフレームをグラフで示す。
【図3】種々の速度に対するボコーダ解析フレームおよびサブフレームをグラフで示す。
【図4】種々の速度に対するボコーダ解析フレームおよびサブフレームをグラフで示す。
【図5】種々の速度に対するボコーダ解析フレームおよびサブフレームをグラフで示す。
【図6】種々の速度に対するボコーダ出力ビット分布を示した一連のチャートである。
【図7】種々の速度に対するボコーダ出力ビット分布を示した一連のチャートである。
【図8】種々の速度に対するボコーダ出力ビット分布を示した一連のチャートである。
【図9】種々の速度に対するボコーダ出力ビット分布を示した一連のチャートである。
【図10】一例のエンコーダの一般化されたブロック図である。
【図11】エンコーダフローチャートである。
【図12】一例のデコーダの一般化されたブロック図である。
【図13】デコーダのフローチャートである。
【図14】エンコーダのさらに詳細な機能的なブロック図である。
【図15】エンコーダのさらに詳細な機能的なブロック図である。
【図16】ハミングウインドウおよび自己相関サブシステムの一例のブロック図である。
【図17】速度決定サブシステムの一例のブロック図である。
【図18】LPC解析サブシステムの一例のブロック図である。
【図19】LPCからLSP伝送サブシステムの一例のブロック図である。
【図20】LPC量子化サブシステムの一例のブロック図である。
【図21】LSP挿入およびLSPからLPC伝送サブシステムの一例のブロック図である。
【図22】ピッチ探索用の適用コードブックのブロック図である。
【図23】エンコーダデコーダのブロック図である。
【図24】ピッチ探索サブシステムのブロック図である。
【図25】コードブック探索サブシステムのブロック図である。
【図26】データパッキングサブシステムのブロック図である。
【図27】デコーダのさらに詳細な機能的ブロック図である。
【図28】種々の速度に対してデコーダの受信されたパラメータおよびサブフレームデコードデータを示したチャートである。
【図29】種々の速度に対してデコーダの受信されたパラメータおよびサブフレームデコードデータを示したチャートである。
【図30】種々の速度に対してデコーダの受信されたパラメータおよびサブフレームデコードデータを示したチャートである。
【図31】種々の速度に対してデコーダの受信されたパラメータおよびサブフレームデコードデータを示したチャートである。
【図32】特別な状態に対してデコーダの受信パラメータおよびサブフレームデコード化データをさらに示したチャートである。
【図33】特別な状態に対してデコーダの受信パラメータおよびサブフレームデコード化データをさらに示したチャートである。
【図34】特別な状態に対してデコーダの受信パラメータおよびサブフレームデコード化データをさらに示したチャートである。
【図35】LSP反転量子化サブシステムのブロック図である。
【図36】ポストフィルタ処理および自動利得制御を備えたデコーダのさらに詳細なブロック図である。
【図37】適応輝度フィルタ特性を示すチャートである。

Claims (63)

  1. コード励起線形予測コーダ(CELPコーダ、code excitedlinear prediction coder、CELP coder)における主要なスピーチと背景ノイズから成る音響信号のデジタル化されたサンプルの入力フレームを可変レートでエンコードする方法において、
    デジタル化されたスピーチサンプルから成る一連の入力フレームのフレーム毎に線形予測符号化係数(LPC係数、linear predictive coding coefficients、LPC coefficients)を算出する工程と、
    少なくとも一つのLPC係数に基づいて一組のデータパケットレートから出力データパケットレートをフレーム毎に選択する工程と、
    LPC係数を表すビット数を選択されたレートにより決まる所定数に制限する工程と、
    選択されたレートにより決まるビット数によりピッチサブフレーム毎に表されるピッチパラメータを、選択されたレートによりフレーム毎に個数が決まる一組の構成ピッチ解析サブフレームのピッチサブフレーム毎に決定する工程と、
    選択されたレートにより決まるビット数によりコードブックサブフレーム毎に表されるコードブックパラメータを、選択されたレートによりフレーム毎に個数が決まる一組の構成コードブック解析サブフレームのコードブックサブフレーム毎に決定する工程と、
    LPC係数と、ピッチおよびコードブックの各サブフレーム用のピッチパラメータおよびコードブックパラメータとを表す対応出力データパケットを構成するビットをフレーム毎に供給する工程とを具備したことを特徴とする方法。
  2. LPC係数を線スペクトル対値(LSP値、line spectral pair (LSP) values)に変換する工程をさらに具備したことを特徴とする請求項1に記載の方法。
  3. フレーム毎に一組のエラー防止ビット(error protectionbits)を供給する工程をさらに具備したことを特徴とする請求項1に記載の方法。
  4. 主要なスピーチと背景ノイズから成る音響信号のデジタル化されたサンプルの入力フレームを可変レートでエンコードするコード励起線形予測コーダ(CELPコーダ、code excited linear prediction coder、CELP coder)において、
    デジタル化されたスピーチサンプルから成る一連の入力フレームのフレーム毎に線形予測符号化係数(LPC係数、linear predictive coding coefficients、LPC coefficients)を算出する手段と、
    少なくとも一つのLPC係数に基づいて一組のデータパケットレートから出力データパケットレートをフレーム毎に選択する手段と
    、LPC係数を表すビット数を選択されたレートにより決まる所定数に制限する手段と、
    選択されたレートにより決まるビット数によりピッチサブフレーム毎に表されるピッチパラメータを、選択されたレートによりフレーム毎に個数が決まる一組の構成ピッチ解析サブフレームのピッチサブフレーム毎に決定する手段と、
    選択されたレートにより決まるビット数によりコードブックサブフレーム毎に表されるコードブックパラメータを、選択されたレートによりフレーム毎に個数が決まる一組の構成コードブック解析サブフレームのコードブックサブフレーム毎に決定する手段とを具備し、
    LPC係数と、ピッチおよびコードブックの各サブフレーム用のピッチパラメータおよびコードブックパラメータとを表す対応出力データパケットを構成するビットを選択されたレートでフレーム毎に供給することを特徴とするコーダ。
  5. ピッチサブフレームは選択されたレートにより個数がフレーム毎に決まり、
    選択された出力データパケットレートがフルレートの場合には、ピッチサブフレームは四個であり、
    選択された出力データパケットレートがハーフレートの場合には、ピッチサブフレームは二個であり、
    選択された出力データパケットレートが四分の一レートの場合には、ピッチサブフレームは一個であることを特徴とする請求項4に記載のコーダ。
  6. 選択されたレートにより個数がフレーム毎に決まるピッチサブフレームには、選択された出力データパケットレートが八分の一レートの場合のピッチサブフレームが存在しないことを特徴とする請求項5に記載のコーダ。
  7. デジタル化されたサンプルに所定のウィンドウ処理機能(predetermined windowing function)により前からの乗法を施す(pre−multiplying)手段をさらに具備したことを特徴とする請求項4に記載のコーダ。
  8. 所定のウィンドウ処理機能がハミングウィンドウ(Hamming window)であることを特徴とする請求項7に記載のコーダ。
  9. エンコードレートを選択する手段が外部のレート信号に応答することを特徴とする請求項4に記載のコーダ。
  10. 出力データパケットがエラー防止用の所定数のビットから成り、このエラー防止用の所定数のビットがオーディオ作用(audio activity)のレベルに応答することを特徴とする請求項4に記載のコーダ。
  11. ピッチパラメータを決定する手段は、選択された出力データパケットレートがフルレートの場合には10ビットから成るピッチパラメータを四種類供給し、選択された出力データパケットレートがハーフレートの場合には10ビットから成るピッチパラメータを二種類供給し、選択された出力データパケットレートが四分の一レートの場合には10ビットから成るピッチパラメータを一種類供給することを特徴とする請求項4に記載のコーダ。
  12. ピッチパラメータを決定する手段は、選択された出力データパケットレートが八分の一レートの場合に制止されることを特徴とする請求項11に記載のコーダ。
  13. コードブックパラメータを決定する手段は、選択された出力データパケットレートがフルレートの場合にはコードブックパラメータを八種類供給し、選択された出力データパケットレートがハーフレートの場合にはコードブックパラメータを四種類供給し、選択された出力データパケットレートが四分の一レートの場合にはコードブックパラメータを二種類供給し、選択された出力データパケットレートが八分の一レートの場合にはコードブックパラメータを一種類供給することを特徴とする請求項11に記載のコーダ。
  14. コードブックパラメータを決定する手段は、選択されたレートがフルレートの場合にはコードブックパラメータ毎に10ビットを供給し、選択されたレートがハーフレートの場合にはコードブックパラメータ毎に10ビットを供給し、選択されレートが四分の一レートの場合にはコードブックパラメータ毎に10ビットを供給し、選択されたレートが八分の一レートの場合にはコードブックパラメータ毎に6ビットを供給することを特徴とする請求項11に記載のコーダ。
  15. LPC係数を表すビット数を制限する手段は、選択されたレートがフルレートの場合にはLPC係数を表すために40ビットを供給し、選択されたレートがハーフレートの場合にはLPC係数を表すために20ビットを供給し、選択されレートが四分の一レートの場合にはLPC係数を表すために10ビットを供給し、選択されたレートがフルレートの場合にはLPC係数を表すために10ビットを供給することを特徴とする請求項4に記載のコーダ。
  16. 所定のスピーチモデル(speech model)に基づく音声作用測定値(a voice activity measurement)にしたがってエンコードされている可変レートコード励起線形予測エンコード化スピーチ信号(可変レートCELPエンコード化スピーチ信号、variable rate code excited linear prediction (CELP) encoded speech signal)のフレームをデコードするデコーダにおいて、エンコードされているフレームをフレーム毎のデータレートにしたがってアンパックして、所定のコードブックインデックスパラメータ、所定のコードブックゲイン値、所定のピッチ値、所定の線形予測値を供給する手段と、
    コードブックインデックスパラメータにしたがって対応コードブック励起ベクトル(corresponding codebook excitation vector)を供給する手段と、
    コードブック励起ベクトルに応じてコードブックゲイン値にしたがってコードブック励起ベクトルを増幅して、ピッチ誤差(pitch residual)を供給する手段と、
    受信したピッチラグとゲイン値とにしたがってピッチ誤差をピッチ合成フィルタリングして、フォルマントを供給する手段と、
    線形予測値にしたがってフォルマント誤差をフォルマント合成フィルタリングして、フレーム用に再構成されたスピーチサンプルを供給する手段とを具備したことを特徴とするデコーダ。
  17. 再構成されたスピーチサンプルを適応フィルタリングして、再構成されたスピーチサンプルの可聴ノイズを減少させる手段と、
    再構成されたスピーチサンプルと適応フィルタリングの済んだ再構成されたスピーチサンプルとの間の単位利得(unity gain)を供給する手段とをさらに具備したことを特徴とする請求項16に記載のデコーダ。
  18. デジタル化されたスピーチデータから成る一連のフレームを複数あるエンコードレートのいずれかのエンコードレートでエンコードする可変レートボコーダの中で、デジタル化されたスピーチデータから成る一連のフレームのスピーチ作用レベル(speech activity level)にしたがってエンコードレートを選択する可変レートボコーダにおいて、
    デジタル化されたスピーチのエネルギーを複数のスピーチ作用閾値と比較する工程と、
    この比較に基づいてスピーチ作用レベルを供給する工程とを具備したことを特徴とするスピーチ作用レベルの決定方法。
  19. 少なくとも一つの先行フレームのスピーチ作用レベルにしたがって複数のスピーチ作用閾値を適応的に変更する工程をさらに具備したことを特徴とする請求項18に記載のスピーチ作用レベルの決定方法。
  20. スピーチ作用レベルにしたがってエンコードレートを決定する工程をさらに具備したことを特徴とする請求項18に記載のスピーチ作用レベルの決定方法。
  21. 主要なスピーチと背景ノイズから成る音響信号のデジタル化されたサンプルの入力フレームを可変レートでエンコードする可変レートコード励起線形予測コーダ(可変レートCELPコーダ、variable rate code excited linear prediction (CELP) coder)において、
    デジタル化されたスピーチサンプルから成る一連の入力フレームのフレーム毎に対応フレームエネルギー値を決定する回路と、
    音響信号のデジタル化されたサンプルから成る一連の入力フレームのフレーム毎に線形予測符号化係数(LPC係数、linear predictive coding coefficients、LPC coefficients)を算出する回路と、
    フレームエネルギー値に基づいて一組のデータパケットレートから出力データパケットレートをフレーム毎に選択する回路と、
    LPC係数を表すビット数を選択されたレートにより決まる所定数に制限する回路と、
    選択されたレートにより決まるビット数によりピッチサブフレーム毎に表されるピッチパラメータを、選択されたレートによりフレーム毎に個数が決まる一組の構成ピッチ解析サブフレームのピッチサブフレーム毎に決定する回路と、
    選択されたレートにより決まるビット数によりコードブックサブフレーム毎に表されるコードブックパラメータを、選択されたレートによりフレーム毎に個数が決まる一組の構成コードブック解析サブフレームのコードブックサブフレーム毎に決定する回路とを具備し、
    LPC係数と、ピッチおよびコードブックの各サブフレーム用のピッチパラメータおよびコードブックパラメータとを表す対応出力データパケットを構成するビットを選択されたレートでフレーム毎に供給することを特徴とするコーダ。
  22. ピッチサブフレームは選択されたレートにより個数がフレーム毎に決まり、
    選択された出力データパケットレートがフルレートの場合には、ピッチサブフレームは四個であり、
    選択された出力データパケットレートがハーフレートの場合には、ピッチサブフレームは二個であり、
    選択された出力データパケットレートが四分の一レートの場合には、ピッチサブフレームは一個であることを特徴とする請求項21に記載のコーダ。
  23. ピッチパラメータを決定する回路は、選択された出力データパケットレートが八分の一レートの場合に、制止されることを特徴とする請求項21に記載のコーダ。
  24. 選択された出力データパケットレートにより決まるピッチパラメータを表すビット数は、
    選択された出力データパケットレートがフルレートの場合にはピッチパラメータ毎に10ビットであり、
    選択された出力データパケットレートがハーフレートの場合にはピッチパラメータ毎に10ビットであり、
    選択された出力データパケットレートが四分の一レートの場合にはピッチパラメータ毎に10ビットであることを特徴とする請求項21に記載のコーダ。
  25. 選択された出力データパケットレートにより決まるピッチパラメータを表すビット数は、選択された出力データパケットレートが八分の一レートの場合にはゼロビットであることを特徴とする請求項21に記載のコーダ。
  26. コードブック解析サブフレームの個数は選択されたレートにより決まり、
    選択された出力データパケットレートがフルレートの場合には、コードブックサブフレームは八個であり、
    選択された出力データパケットレートがハーフレートの場合には、コードブックサブフレームは四個であり、
    選択された出力データパケットレートが四分の一レートの場合には、コードブックサブフレームは二個であり、
    選択された出力データパケットレートが八分の一レートの場合には、コードブックサブフレームは一個であることを特徴とする請求項21に記載のコーダ。
  27. コードブックパラメータは、選択されたレートにより決まるビット数により表され、
    選択されたレートがフルレートの場合には、コードブックパラメータ毎に10ビットで表され、
    選択されたレートがハーフレートの場合には、コードブックパラメータ毎に10ビットで表され、
    選択されたレートが四分の一レートの場合には、コードブックパラメータ毎に10ビットで表され、
    選択されたレートが八分の一レートの場合には、コードブックパラメータ毎に6ビットで表されることを特徴とする請求項26に記載のコーダ。
  28. LPC係数を表すビット数を制限する手段が、
    選択されたレートがフルレートの場合にLPC係数を表すために40ビットを供給する回路と、
    選択されたレートがハーフレートの場合にLPC係数を表すために20ビットを供給する回路と、
    選択されたレートが四分の一レートの場合にLPC係数を表すために10ビットを供給する回路と、
    選択されたレートが八分の一レートの場合にLPC係数を表すために10ビットを供給する回路とを具備したことを特徴とする請求項21に記載のコーダ。
  29. 音響信号のフォルマント周波数に挟まれた周波数帯内の再構成された音響信号を減衰する後置フィルタを備え、可変レートコード励起線形予測コーダ(可変レートCELPコーダ、variable rate code excited linearprediction (CELP) coder)によりエンコードされたフレームをデコードするデコーダにおいて、
    後置フィルタにより導入される再構成されたスピーチのスペクトル傾斜を補償することにより再構成されたスピーチの知覚品質を高める方法であり、
    後置フィルタにより処理されたスピーチのスペクトル傾斜値を決定する工程と、
    スペクトル傾斜値にしたがって一組のフィルタ係数を決定する工程と、
    後置フィルタにより処理されたスピーチを決定された一組のフィルタ係数にしたがってフィルタリングする工程とを具備した方法。
  30. 可変レートコード励起線形予測コーダ(可変レートCELPコーダ、variable rate code excited linear prediction (CELP) coder)において、主要なスピーチと背景ノイズから成る音響信号のデジタル化されたサンプルの入力フレームを可変レートでエンコードする方法であり、
    デジタル化されたスピーチサンプルから成る一連の入力フレームのフレーム毎にフレームエネルギーレベルを決定する工程と、
    決定されたフレームエネルギーレベルに基づいて一組のデータパケットレートから出力データパケットレートをフレーム毎に選択する工程と、
    フレーム毎に線形予測符号化係数(LPC係数)を算出する工程と、
    LPC係数を表すビット数を選択されたレートにより決まる所定数に制限する工程と、
    選択されたレートにより決まるビット数によりピッチサブフレーム毎に表されるピッチパラメータを、選択されたレートによりフレーム毎に個数が決まる一組の構成ピッチ解析サブフレームのピッチサブフレーム毎に決定する工程と、
    選択されたレートにより決まるビット数によりコードブックサブフレーム毎に表されるコードブックパラメータを、選択されたレートによりフレーム毎に個数が決まる一組の構成コードブック解析サブフレームのコードブックサブフレーム毎に決定する工程と、
    LPC係数と、ピッチおよびコードブックの各サブフレーム用のピッチパラメータおよびコードブックパラメータとを表す対応出力データパケットを構成するビットをフレーム毎に供給する工程とを具備したことを特徴とする方法。
  31. 主要なスピーチと背景ノイズから成る音響信号のデジタル化されたサンプルの入力フレームを可変レートでエンコードするコード励起線形予測コーダ(CELPコーダ)において、
    音響信号のデジタル化されたサンプルから成る一連の入力フレームのフレーム毎にフレームエネルギーレベルを決定する手段と、
    決定されたフレームエネルギーレベルに基づいて一組のデータパケットレートから出力データパケットレートをフレーム毎に選択する手段と、
    フレーム毎に線形予測符号化係数(LPC係数)を算出する手段と、
    LPC係数を表すビット数を選択されたレートにより決まる所定数に制限する手段と、
    選択されたレートにより決まるビット数によりピッチサブフレーム毎に表されるピッチパラメータを、選択されたレートによりフレーム毎に個数が決まる一組の構成ピッチ解析サブフレームのピッチサブフレーム毎に決定する手段と、
    選択されたレートにより決まるビット数によりコードブックサブフレーム毎に表されるコードブックパラメータを、選択されたレートによりフレーム毎に個数が決まる一組の構成コードブック解析サブフレームのコードブックサブフレーム毎に決定する手段とを具備し、
    LPC係数と、ピッチおよびコードブックの各サブフレーム用のピッチパラメータおよびコードブックパラメータとを表す対応出力データパケットを構成するビットをフレーム毎に選択されたレートで供給することを特徴とするコーダ。
  32. 可変レートコード励起線形予測データ(可変レートCELPデータ、variable rate code excited linear prediction data)から成り、所定のスピーチモデルに基づく音声作用測定値(a voice activity measurement)にしたがってエンコードされているフレームを当該可変レートCELPデータのレートにしたがってアンパックする工程と、
    可変レートCELPデータのフレームにしたがって音声信号を生成する工程とを具備するデコード方法。
  33. 可変レートCELPデータのフレームをアンパックする工程には、線形予測符号化係数(LPC係数、linear predictive coding coefficients、LPC coefficients)を可変レートCELPデータのレートにしたがって決まる個数だけアンパックすることが含まれている請求項32に記載のデコード方法。
  34. 可変レートCELPデータのフレームをアンパックする工程には、ピッチ予測値(pitch prediction values)を可変レートCELPデータのレートにしたがって決まる個数だけアンパックすることが含まれている請求項32に記載のデコード方法。
  35. 可変レートCELPデータのフレームをアンパックする工程には、フィルタ励起値(filter excitation values)を可変レートCELPデータのレートにしたがって決まる個数だけアンパックすることが含まれている請求項32に記載のデコード方法。
  36. 線形予測符号化アルゴリズムに従ってコード化されたデータのフレームを受信するデコーダにおいて、
    正確に受信されたフレームのパラメータデータを記憶するメモリ手段と、
    エラーで受信されたフレームの少なくとも1つのパラメータを前記メモリ手段に記憶された少なくとも1つのパラメータで置換するマスク手段とを含む、フレームエラーをマスクする装置。
  37. 前記マスク手段はエラーで置換される前記フレームの全てのパラメータを前記メモリ手段に記憶されたパラメータで置換する請求項36記載の装置。
  38. 前記マスク手段はエラーで置換される前記フレームの選択されたパラメータを前記メモリ手段で選択されたパラメータで置換する請求項36記載の装置。
  39. 前記マスク手段はエラーで置換される前記フレームの全てのパラメータを、前記メモリ手段に記憶されたパラメータと前記メモリ手段に記憶されたパラメータの修正されたバージョンとの組み合わせで置換する請求項36記載の装置。
  40. 前記マスク手段はエラーで受信された前記フレームのコードブック利得パラメータを略ゼロに等しい値で置換する請求項36記載の装置。
  41. 前記マスク手段はエラーで受信された前記フレームのピッチ利得パラメータを1以下の値に制限された前記メモリ手段に記憶されたピッチ利得値で置換する請求項36または40記載の装置。
  42. 前記マスク手段はエラーで受信された前記フレームのピッチ利得パラメータを略ゼロに等しい値で置換する請求項36記載の装置。
  43. 前記マスク手段はランダムコードブック励起ベクトル索引を選択し、エラーで受信された前記フレームのコードブック励起ベクトル索引を前記ランダムに選択されたコードブック励起ベクトル索引で置換する請求項36または42記載の装置。
  44. 前記マスク手段はエラーで受信された前記フレームのコードブック利得値を前記メモリ手段に記憶されたコードブック利得値の修正されたバージョンで置換する請求項36、42および43の何れかに記載の装置。
  45. 前記マスク手段はエラーで受信された前記フレームのコードブック利得値を前記メモリ手段に記憶されたコードブック利得値の縮小されたバージョンで置換する請求項44記載の装置。
  46. 前記マスク手段はエラーで受信された前記フレームのコードブック利得値を、略0.7に等しい値に縮小された前記メモリ手段に記憶されたコードブック利得値で置換する請求項45記載の装置。
  47. 前記マスク手段はエラーで受信された前記フレームの少なくとも1つのLSPパラメータを前記メモリ手段に記憶されたLSPパラメータの修正されたバージョンで置換する請求項36、42、43および44の何れかに記載の装置。
  48. 前記マスク手段は前記修正されたバージョンを予定のバイアス値に附勢するように、前記メモリ手段に記憶されたLSPパラメータの前記修正されたバージョンを生成する請求項47記載の装置。
  49. 前記マスク手段は、前記フレームが送信局により故意にブランクのままにされたとき、第1のマスクアルゴリズムを選択し、前記フレームがチャンネルエラーの過多の結果としてエラーで受信されたとき、第2のマスクアルゴリズムを選択する請求項36記載の装置。
  50. 線形予測符号化アルゴリズムに従ってコード化されたデータのフレームを受信するデコーダにおいて、
    正確に受信されたフレームのパラメータデータを記憶し、
    エラーで受信されたフレームの少なくとも1つのパラメータを少なくとも1つの記憶されたパラメータで置換することを含む、フレームエラーをマスクする方法。
  51. 前記置換することがエラーで置換される前記フレームの全てのパラメータを記憶されたパラメータで置換することを含む請求項50記載の方法。
  52. 前記置換することがエラーで置換される前記フレームの選択されたパラメータを選択され記憶されたパラメータで置換することを含む請求項50記載の方法。
  53. 前記置換することがエラーで置換される前記フレームの全てのパラメータを、前記記憶されたパラメータと前記記憶されたパラメータの修正されたバージョンとの組み合わせで置換することを含む請求項50記載の方法。
  54. 前記置換することがエラーで受信された前記フレームのコードブック利得パラメータを略ゼロに等しい値で置換することを含む請求項50記載の方法。
  55. 前記置換することがエラーで受信された前記フレームのピッチ利得パラメータを1以下の値に制限された記憶されたピッチ利得値で置換することを含む請求項50または54記載の方法。
  56. 前記置換することがエラーで受信された前記フレームのピッチ利得パラメータを略ゼロに等しい値で置換することを含む請求項50記載の方法。
  57. 前記置換することがランダムコードブック励起ベクトル索引を選択し、エラーで受信された前記フレームのコードブック励起ベクトル索引を前記ランダムに選択されたコードブック励起ベクトル索引で置換することを含む請求項50または56記載の方法。
  58. 前記置換することがエラーで受信された前記フレームのコードブック利得値を記憶されたコードブック利得値の修正されたバージョンで置換することを含む請求項50、56および57の何れかに記載の方法。
  59. 前記置換することがエラーで受信された前記フレームのコードブック利得値を記憶されたコードブック利得値の縮小されたバージョンで置換することを含む請求項58記載の方法。
  60. 前記置換することがエラーで受信された前記フレームのコードブック利得値を、略0.7に等しい値に縮小された記憶されたコードブック利得値で置換することを含む請求項59記載の方法。
  61. 前記置換することがエラーで受信された前記フレームの少なくとも1つのLSPパラメータを記憶されたLSPパラメータの修正されたバージョンで置換することを含む請求項50、56、57および58の何れかに記載の方法。
  62. 前記置換することが前記修正されたバージョンを予定のバイアス値に附勢するように、前記記憶されたLSPパラメータの前記修正されたバージョンを生成することを含む請求項61記載の方法。
  63. 前記置換することは、前記フレームが送信局により故意にブランクのままにされたとき、第1のマスクアルゴリズムを選択し、前記フレームがチャンネルエラーの過多の結果としてエラーで受信されたとき、第2のマスクアルゴリズムを選択することを含む請求項50記載の方法。
JP2003172114A 1991-06-11 2003-06-17 エンコードまたはデコードの方法および装置 Expired - Lifetime JP3751957B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US71366191A 1991-06-11 1991-06-11

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001144031A Division JP3566669B2 (ja) 1991-06-11 2001-05-14 フレームエラーをマスクする方法および装置

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2005018692A Division JP3955600B2 (ja) 1991-06-11 2005-01-26 背景ノイズエネルギーレベルを見積もる方法と装置
JP2005273821A Division JP3964915B2 (ja) 1991-06-11 2005-09-21 エンコードまたはデコードの方法および装置

Publications (2)

Publication Number Publication Date
JP2004004897A true JP2004004897A (ja) 2004-01-08
JP3751957B2 JP3751957B2 (ja) 2006-03-08

Family

ID=24866989

Family Applications (7)

Application Number Title Priority Date Filing Date
JP50090293A Expired - Lifetime JP3432822B2 (ja) 1991-06-11 1992-06-03 可変速度ボコーダ
JP2001144031A Expired - Lifetime JP3566669B2 (ja) 1991-06-11 2001-05-14 フレームエラーをマスクする方法および装置
JP2001343016A Pending JP2002202800A (ja) 1991-06-11 2001-11-08 背景ノイズエネルギーレベルを見積もる方法と装置
JP2003172114A Expired - Lifetime JP3751957B2 (ja) 1991-06-11 2003-06-17 エンコードまたはデコードの方法および装置
JP2005018692A Expired - Lifetime JP3955600B2 (ja) 1991-06-11 2005-01-26 背景ノイズエネルギーレベルを見積もる方法と装置
JP2005273821A Expired - Lifetime JP3964915B2 (ja) 1991-06-11 2005-09-21 エンコードまたはデコードの方法および装置
JP2006108635A Expired - Lifetime JP4191746B2 (ja) 1991-06-11 2006-04-11 背景ノイズエネルギーレベルを見積もる方法と装置

Family Applications Before (3)

Application Number Title Priority Date Filing Date
JP50090293A Expired - Lifetime JP3432822B2 (ja) 1991-06-11 1992-06-03 可変速度ボコーダ
JP2001144031A Expired - Lifetime JP3566669B2 (ja) 1991-06-11 2001-05-14 フレームエラーをマスクする方法および装置
JP2001343016A Pending JP2002202800A (ja) 1991-06-11 2001-11-08 背景ノイズエネルギーレベルを見積もる方法と装置

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP2005018692A Expired - Lifetime JP3955600B2 (ja) 1991-06-11 2005-01-26 背景ノイズエネルギーレベルを見積もる方法と装置
JP2005273821A Expired - Lifetime JP3964915B2 (ja) 1991-06-11 2005-09-21 エンコードまたはデコードの方法および装置
JP2006108635A Expired - Lifetime JP4191746B2 (ja) 1991-06-11 2006-04-11 背景ノイズエネルギーレベルを見積もる方法と装置

Country Status (21)

Country Link
US (3) US5414796A (ja)
EP (8) EP1126437B1 (ja)
JP (7) JP3432822B2 (ja)
CN (8) CN1196271C (ja)
AT (4) ATE272883T1 (ja)
AU (3) AU671952B2 (ja)
BR (1) BR9206143A (ja)
CA (6) CA2568984C (ja)
DE (4) DE69232202T2 (ja)
DK (2) DK0588932T3 (ja)
ES (4) ES2225321T3 (ja)
FI (5) FI120425B (ja)
HK (3) HK1014796A1 (ja)
HU (1) HU215861B (ja)
IL (4) IL102146A (ja)
MX (1) MX9202808A (ja)
NO (1) NO319559B1 (ja)
RU (1) RU2107951C1 (ja)
SG (1) SG70558A1 (ja)
WO (1) WO1992022891A1 (ja)
ZA (1) ZA924082B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019505840A (ja) * 2016-01-03 2019-02-28 アウロ テクノロジーズ エンフェー. 予測器モデルを使用する信号符号器、復号器及び方法

Families Citing this family (499)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7606575B2 (en) * 1988-08-04 2009-10-20 Broadcom Corporation Remote radio data communication system with data rate switching
US20010050943A1 (en) * 1989-08-03 2001-12-13 Mahany Ronald L. Radio frequency communication network having adaptive communication parameters
US6693951B1 (en) 1990-06-25 2004-02-17 Qualcomm Incorporated System and method for generating signal waveforms in a CDMA cellular telephone system
BR9206143A (pt) * 1991-06-11 1995-01-03 Qualcomm Inc Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados
US5355450A (en) 1992-04-10 1994-10-11 Avid Technology, Inc. Media composer with adjustable source material compression
WO1993012613A1 (en) * 1991-12-13 1993-06-24 Avid Technology, Inc. Quantization table adjustment
SE469764B (sv) * 1992-01-27 1993-09-06 Ericsson Telefon Ab L M Saett att koda en samplad talsignalvektor
TW224191B (ja) * 1992-01-28 1994-05-21 Qualcomm Inc
CA2105269C (en) * 1992-10-09 1998-08-25 Yair Shoham Time-frequency interpolation with application to low rate speech coding
FI95086C (fi) * 1992-11-26 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin tehokkaaksi koodaamiseksi
US5452289A (en) 1993-01-08 1995-09-19 Multi-Tech Systems, Inc. Computer-based multifunction personal communications system
US5546395A (en) 1993-01-08 1996-08-13 Multi-Tech Systems, Inc. Dynamic selection of compression rate for a voice compression algorithm in a voice over data modem
US5754589A (en) 1993-01-08 1998-05-19 Multi-Tech Systems, Inc. Noncompressed voice and data communication over modem for a computer-based multifunction personal communications system
US5812534A (en) 1993-01-08 1998-09-22 Multi-Tech Systems, Inc. Voice over data conferencing for a computer-based personal communications system
US5535204A (en) 1993-01-08 1996-07-09 Multi-Tech Systems, Inc. Ringdown and ringback signalling for a computer-based multifunction personal communications system
US5453986A (en) 1993-01-08 1995-09-26 Multi-Tech Systems, Inc. Dual port interface for a computer-based multifunction personal communication system
US5617423A (en) 1993-01-08 1997-04-01 Multi-Tech Systems, Inc. Voice over data modem with selectable voice compression
US6009082A (en) 1993-01-08 1999-12-28 Multi-Tech Systems, Inc. Computer-based multifunction personal communication system with caller ID
US5864560A (en) 1993-01-08 1999-01-26 Multi-Tech Systems, Inc. Method and apparatus for mode switching in a voice over data computer-based personal communications system
US5657423A (en) * 1993-02-22 1997-08-12 Texas Instruments Incorporated Hardware filter circuit and address circuitry for MPEG encoded data
CN1125031A (zh) * 1993-04-16 1996-06-19 数据翻译公司 采用可变量化的自适应视频压缩
AU683056B2 (en) * 1993-04-16 1997-10-30 Media 100 Inc. Adaptive video decompression
FI96248C (fi) * 1993-05-06 1996-05-27 Nokia Mobile Phones Ltd Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin
US5659659A (en) * 1993-07-26 1997-08-19 Alaris, Inc. Speech compressor using trellis encoding and linear prediction
ZA946674B (en) * 1993-09-08 1995-05-02 Qualcomm Inc Method and apparatus for determining the transmission data rate in a multi-user communication system
US5649299A (en) * 1993-10-27 1997-07-15 Motorola, Inc. Apparatus and method for adapting a digital radiotelephone system to increased subscriber traffic
US6005856A (en) 1993-11-01 1999-12-21 Omnipoint Corporation Communication protocol for spread spectrum wireless communication system
US6094575A (en) 1993-11-01 2000-07-25 Omnipoint Corporation Communication system and method
WO1995012945A1 (en) * 1993-11-01 1995-05-11 Omnipoint Corporation Despreading/demodulating direct sequence spread spectrum signals
US6088590A (en) 1993-11-01 2000-07-11 Omnipoint Corporation Method and system for mobile controlled handoff and link maintenance in spread spectrum communication
JP3182032B2 (ja) * 1993-12-10 2001-07-03 株式会社日立国際電気 音声符号化通信方式及びその装置
US5621852A (en) * 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
JP3889038B2 (ja) * 1994-02-17 2007-03-07 モトローラ・インコーポレイテッド 通信システムにおいて符号化レートを制御する方法および装置
CA2142391C (en) * 1994-03-14 2001-05-29 Juin-Hwey Chen Computational complexity reduction during frame erasure or packet loss
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss
US5574825A (en) * 1994-03-14 1996-11-12 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
US5757801A (en) 1994-04-19 1998-05-26 Multi-Tech Systems, Inc. Advanced priority statistical multiplexer
US5682386A (en) 1994-04-19 1997-10-28 Multi-Tech Systems, Inc. Data/voice/fax compression multiplexer
FI98162C (fi) * 1994-05-30 1997-04-25 Tecnomen Oy HMM-malliin perustuva puheentunnistusmenetelmä
US5602961A (en) * 1994-05-31 1997-02-11 Alaris, Inc. Method and apparatus for speech compression using multi-mode code excited linear predictive coding
US5638412A (en) 1994-06-15 1997-06-10 Qualcomm Incorporated Method for providing service and rate negotiation in a mobile communication system
US5603096A (en) * 1994-07-11 1997-02-11 Qualcomm Incorporated Reverse link, closed loop power control in a code division multiple access system
TW271524B (ja) * 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5856998A (en) 1994-09-09 1999-01-05 Omnipoint Corporation Method and apparatus for correlating a continuous phase modulated spread spectrum signal
US5953370A (en) 1994-09-09 1999-09-14 Omnipoint Corporation Apparatus for receiving and correlating a spread spectrum signal
US5627856A (en) 1994-09-09 1997-05-06 Omnipoint Corporation Method and apparatus for receiving and despreading a continuous phase-modulated spread spectrum signal using self-synchronizing correlators
US5648982A (en) 1994-09-09 1997-07-15 Omnipoint Corporation Spread spectrum transmitter
US5610940A (en) 1994-09-09 1997-03-11 Omnipoint Corporation Method and apparatus for noncoherent reception and correlation of a continous phase modulated signal
US5963586A (en) 1994-09-09 1999-10-05 Omnipoint Corporation Method and apparatus for parallel noncoherent correlation of a spread spectrum signal
US5754584A (en) 1994-09-09 1998-05-19 Omnipoint Corporation Non-coherent spread-spectrum continuous-phase modulation communication system
US5757847A (en) 1994-09-09 1998-05-26 Omnipoint Corporation Method and apparatus for decoding a phase encoded signal
US5692007A (en) 1994-09-09 1997-11-25 Omnipoint Corporation Method and apparatus for differential phase encoding and decoding in spread-spectrum communication systems with continuous-phase modulation
US5754585A (en) 1994-09-09 1998-05-19 Omnipoint Corporation Method and apparatus for serial noncoherent correlation of a spread spectrum signal
US5881100A (en) 1994-09-09 1999-03-09 Omnipoint Corporation Method and apparatus for coherent correlation of a spread spectrum signal
US5832028A (en) 1994-09-09 1998-11-03 Omnipoint Corporation Method and apparatus for coherent serial correlation of a spread spectrum signal
US5680414A (en) 1994-09-09 1997-10-21 Omnipoint Corporation Synchronization apparatus and method for spread spectrum receiver
US5629956A (en) 1994-09-09 1997-05-13 Omnipoint Corporation Method and apparatus for reception and noncoherent serial correlation of a continuous phase modulated signal
US5659574A (en) 1994-09-09 1997-08-19 Omnipoint Corporation Multi-bit correlation of continuous phase modulated signals
US6141353A (en) * 1994-09-15 2000-10-31 Oki Telecom, Inc. Subsequent frame variable data rate indication method for various variable data rate systems
US5537410A (en) * 1994-09-15 1996-07-16 Oki Telecom Subsequent frame variable data rate indication method
JPH08102687A (ja) * 1994-09-29 1996-04-16 Yamaha Corp 音声送受信方式
DE69525590D1 (de) * 1994-10-05 2002-04-04 Advanced Micro Devices Inc Vorrichtung und Verfahren zur Sprachsignalanalyse zur Parameterbestimmung von Sprachsignalmerkmalen
US5546448A (en) * 1994-11-10 1996-08-13 Multi-Tech Systems, Inc. Apparatus and method for a caller ID modem interface
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
JPH08179796A (ja) * 1994-12-21 1996-07-12 Sony Corp 音声符号化方法
FR2729246A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
US5784403A (en) * 1995-02-03 1998-07-21 Omnipoint Corporation Spread spectrum correlation using saw device
JP3303580B2 (ja) * 1995-02-23 2002-07-22 日本電気株式会社 音声符号化装置
US6292476B1 (en) 1997-04-16 2001-09-18 Qualcomm Inc. Method and apparatus for providing variable rate data in a communications system using non-orthogonal overflow channels
ZA961025B (en) * 1995-02-28 1996-07-16 Qualcomm Inc Method and apparatus for providing variable rate data in a communications system using non-orthogonal overflow channels
US5991725A (en) * 1995-03-07 1999-11-23 Advanced Micro Devices, Inc. System and method for enhanced speech quality in voice storage and retrieval systems
US5699478A (en) * 1995-03-10 1997-12-16 Lucent Technologies Inc. Frame erasure compensation technique
JPH08263099A (ja) * 1995-03-23 1996-10-11 Toshiba Corp 符号化装置
TW347616B (en) 1995-03-31 1998-12-11 Qualcomm Inc Method and apparatus for performing fast power control in a mobile communication system a method and apparatus for controlling transmission power in a mobile communication system is disclosed.
US6977967B1 (en) * 1995-03-31 2005-12-20 Qualcomm Incorporated Method and apparatus for performing fast power control in a mobile communication system
US6137840A (en) 1995-03-31 2000-10-24 Qualcomm Incorporated Method and apparatus for performing fast power control in a mobile communication system
US5548253A (en) * 1995-04-17 1996-08-20 Omnipoint Corporation Spectrally efficient quadrature amplitude modulator
US5508708A (en) * 1995-05-08 1996-04-16 Motorola, Inc. Method and apparatus for location finding in a CDMA system
JP2728122B2 (ja) * 1995-05-23 1998-03-18 日本電気株式会社 無音圧縮音声符号化復号化装置
US5959980A (en) 1995-06-05 1999-09-28 Omnipoint Corporation Timing adjustment control for efficient time division duplex communication
US5745484A (en) * 1995-06-05 1998-04-28 Omnipoint Corporation Efficient communication system using time division multiplexing and timing adjustment control
US5802046A (en) * 1995-06-05 1998-09-01 Omnipoint Corporation Efficient time division duplex communication system with interleaved format and timing adjustment control
US5689502A (en) * 1995-06-05 1997-11-18 Omnipoint Corporation Efficient frequency division duplex communication system with interleaved format and timing adjustment control
US6356607B1 (en) 1995-06-05 2002-03-12 Omnipoint Corporation Preamble code structure and detection method and apparatus
US6526038B1 (en) * 1995-06-07 2003-02-25 Telcordia Technologies, Inc. Periodic wireless broadcast
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
US6885652B1 (en) 1995-06-30 2005-04-26 Interdigital Technology Corporation Code division multiple access (CDMA) communication system
ZA965340B (en) 1995-06-30 1997-01-27 Interdigital Tech Corp Code division multiple access (cdma) communication system
US7020111B2 (en) 1996-06-27 2006-03-28 Interdigital Technology Corporation System for using rapid acquisition spreading codes for spread-spectrum communications
US7929498B2 (en) 1995-06-30 2011-04-19 Interdigital Technology Corporation Adaptive forward power control and adaptive reverse power control for spread-spectrum communications
FI100157B (fi) * 1995-07-12 1997-09-30 Nokia Mobile Phones Ltd Muuttuvanopeuksiset piirikytketyt siirtopalvelut TDMA-pohjaisissa solu kkojärjestelmissä
US6041046A (en) * 1995-07-14 2000-03-21 Omnipoint Corporation Cyclic time hopping in time division multiple access communication system
US5754733A (en) * 1995-08-01 1998-05-19 Qualcomm Incorporated Method and apparatus for generating and encoding line spectral square roots
FR2737948B1 (fr) * 1995-08-16 1997-10-17 Alcatel Mobile Comm France Dispositif de commande de volume sonore pour recepteur de signaux de parole codes par blocs
JP3522012B2 (ja) * 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
US6130888A (en) * 1995-08-31 2000-10-10 Ntt Mobile Communications Network, Inc. ATM transmission method having silence compression controlling function and system transmitter and receiver using the method
US5950164A (en) * 1995-09-29 1999-09-07 Olympus Optical Co., Ltd. Voice recording apparatus capable of displaying remaining recording capacity of memory according to encoding bit rates
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
JP3680380B2 (ja) * 1995-10-26 2005-08-10 ソニー株式会社 音声符号化方法及び装置
JPH09152896A (ja) * 1995-11-30 1997-06-10 Oki Electric Ind Co Ltd 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5822721A (en) * 1995-12-22 1998-10-13 Iterated Systems, Inc. Method and apparatus for fractal-excited linear predictive coding of digital signals
US5737716A (en) * 1995-12-26 1998-04-07 Motorola Method and apparatus for encoding speech using neural network technology for speech classification
US5839052A (en) * 1996-02-08 1998-11-17 Qualcom Incorporated Method and apparatus for integration of a wireless communication system with a cable television system
US5867763A (en) * 1996-02-08 1999-02-02 Qualcomm Incorporated Method and apparatus for integration of a wireless communication system with a cable T.V. system
JPH09230896A (ja) * 1996-02-28 1997-09-05 Sony Corp 音声合成装置
US5754537A (en) * 1996-03-08 1998-05-19 Telefonaktiebolaget L M Ericsson (Publ) Method and system for transmitting background noise data
CN1135786C (zh) * 1996-03-27 2004-01-21 摩托罗拉公司 在无线通信系统中用来提供多方话音连接的方法和装置
SE506341C2 (sv) * 1996-04-10 1997-12-08 Ericsson Telefon Ab L M Metod och anordning för rekonstruktion av en mottagen talsignal
GB2312360B (en) * 1996-04-12 2001-01-24 Olympus Optical Co Voice signal coding apparatus
US5708757A (en) * 1996-04-22 1998-01-13 France Telecom Method of determining parameters of a pitch synthesis filter in a speech coder, and speech coder implementing such method
US6205190B1 (en) * 1996-04-29 2001-03-20 Qualcomm Inc. System and method for reducing interference generated by a CDMA communications device
US5937374A (en) * 1996-05-15 1999-08-10 Advanced Micro Devices, Inc. System and method for improved pitch estimation which performs first formant energy removal for a frame using coefficients from a prior frame
US6047254A (en) * 1996-05-15 2000-04-04 Advanced Micro Devices, Inc. System and method for determining a first formant analysis filter and prefiltering a speech signal for improved pitch estimation
JP3092652B2 (ja) * 1996-06-10 2000-09-25 日本電気株式会社 音声再生装置
US6766176B1 (en) 1996-07-23 2004-07-20 Qualcomm Incorporated Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone
JP3266819B2 (ja) * 1996-07-30 2002-03-18 株式会社エイ・ティ・アール人間情報通信研究所 周期信号変換方法、音変換方法および信号分析方法
US5883927A (en) * 1996-07-31 1999-03-16 Nextwave Telecom, Inc. Digital wireless telecommunication device for reduced interference with hearing aids
JPH1049199A (ja) * 1996-08-02 1998-02-20 Nec Corp 無音圧縮音声符号化復号化装置
US5726983A (en) * 1996-08-09 1998-03-10 Motorola, Inc. Communication device with variable frame processing time
US5812968A (en) * 1996-08-28 1998-09-22 Ericsson, Inc. Vocoder apparatus using the link margin
US5881053A (en) * 1996-09-13 1999-03-09 Qualcomm Incorporated Method for a wireless communications channel
SE507370C2 (sv) * 1996-09-13 1998-05-18 Ericsson Telefon Ab L M Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare
US6205130B1 (en) 1996-09-25 2001-03-20 Qualcomm Incorporated Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters
US7788092B2 (en) * 1996-09-25 2010-08-31 Qualcomm Incorporated Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters
EP0928521A1 (en) * 1996-09-25 1999-07-14 Qualcomm Incorporated Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters
US6014622A (en) 1996-09-26 2000-01-11 Rockwell Semiconductor Systems, Inc. Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
US5954834A (en) * 1996-10-09 1999-09-21 Ericsson Inc. Systems and methods for communicating desired audio information over a communications medium
US5905794A (en) * 1996-10-15 1999-05-18 Multi-Tech Systems, Inc. Caller identification interface using line reversal detection
US6496543B1 (en) * 1996-10-29 2002-12-17 Qualcomm Incorporated Method and apparatus for providing high speed data communications in a cellular environment
US5781593A (en) * 1996-11-14 1998-07-14 Omnipoint Corporation Methods and apparatus for vocoder synchronization in mobile communication network
US6141373A (en) * 1996-11-15 2000-10-31 Omnipoint Corporation Preamble code structure and detection method and apparatus
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
US6172965B1 (en) * 1996-12-23 2001-01-09 Nortel Networks Limited Duplex transmission scheme
JP2856185B2 (ja) * 1997-01-21 1999-02-10 日本電気株式会社 音声符号化復号化システム
IL124578A0 (en) * 1997-01-23 1999-01-26 Motorola Inc Apparatus and method for non-linear processing in a communication system
US6335922B1 (en) 1997-02-11 2002-01-01 Qualcomm Incorporated Method and apparatus for forward link rate scheduling
US7751370B2 (en) 2001-07-13 2010-07-06 Qualcomm Incorporated Method and apparatus for forward link rate scheduling
JP3067676B2 (ja) * 1997-02-13 2000-07-17 日本電気株式会社 Lspの予測符号化装置及び方法
US6014375A (en) * 1997-02-13 2000-01-11 Ericsson Inc. TDMA radio protocol with adaptive vocoder selection
US5832443A (en) * 1997-02-25 1998-11-03 Alaris, Inc. Method and apparatus for adaptive audio compression and decompression
US6104993A (en) * 1997-02-26 2000-08-15 Motorola, Inc. Apparatus and method for rate determination in a communication system
CN1158807C (zh) * 1997-02-27 2004-07-21 西门子公司 尤其在gsm传输中的用于错误掩蔽的帧错误检测的方法和设备
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
US6282228B1 (en) 1997-03-20 2001-08-28 Xircom, Inc. Spread spectrum codes for use in communication
US6480521B1 (en) * 1997-03-26 2002-11-12 Qualcomm Incorporated Method and apparatus for transmitting high speed data in a spread spectrum communications system
US5907822A (en) * 1997-04-04 1999-05-25 Lincom Corporation Loss tolerant speech decoder for telecommunications
DE69834093T2 (de) * 1997-04-07 2006-12-14 Koninklijke Philips Electronics N.V. Sprachübertragungssystem mit veränderlicher bitrate
KR100198476B1 (ko) * 1997-04-23 1999-06-15 윤종용 노이즈에 견고한 스펙트럼 포락선 양자화기 및 양자화 방법
US6014623A (en) * 1997-06-12 2000-01-11 United Microelectronics Corp. Method of encoding synthetic speech
US6075792A (en) 1997-06-16 2000-06-13 Interdigital Technology Corporation CDMA communication system which selectively allocates bandwidth upon demand
US6044343A (en) * 1997-06-27 2000-03-28 Advanced Micro Devices, Inc. Adaptive speech recognition with selective input data to a speech classifier
US6032116A (en) * 1997-06-27 2000-02-29 Advanced Micro Devices, Inc. Distance measure in a speech recognition system for speech recognition using frequency shifting factors to compensate for input signal frequency shifts
US6003003A (en) * 1997-06-27 1999-12-14 Advanced Micro Devices, Inc. Speech recognition system having a quantizer using a single robust codebook designed at multiple signal to noise ratios
US6175590B1 (en) 1997-08-08 2001-01-16 Qualcomm Inc. Method and apparatus for determining the rate of received data in a variable rate communication system
US6097972A (en) * 1997-08-29 2000-08-01 Qualcomm Incorporated Method and apparatus for processing power control signals in CDMA mobile telephone system
WO1999012155A1 (en) * 1997-09-30 1999-03-11 Qualcomm Incorporated Channel gain modification system and method for noise reduction in voice communication
US6058359A (en) * 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
US6049537A (en) * 1997-09-05 2000-04-11 Motorola, Inc. Method and system for controlling speech encoding in a communication system
US5898696A (en) * 1997-09-05 1999-04-27 Motorola, Inc. Method and system for controlling an encoding rate in a variable rate communication system
US6920150B1 (en) * 1997-09-30 2005-07-19 Lucent Technologies Inc. Adaptive communications transcoding and error control
US5897613A (en) * 1997-10-08 1999-04-27 Lucent Technologies Inc. Efficient transmission of voice silence intervals
US6070136A (en) * 1997-10-27 2000-05-30 Advanced Micro Devices, Inc. Matrix quantization with vector quantization error compensation for robust speech recognition
US6067515A (en) * 1997-10-27 2000-05-23 Advanced Micro Devices, Inc. Split matrix quantization with split vector quantization error compensation and selective enhanced processing for robust speech recognition
US5953695A (en) * 1997-10-29 1999-09-14 Lucent Technologies Inc. Method and apparatus for synchronizing digital speech communications
US9118387B2 (en) 1997-11-03 2015-08-25 Qualcomm Incorporated Pilot reference transmission for a wireless communication system
US7184426B2 (en) 2002-12-12 2007-02-27 Qualcomm, Incorporated Method and apparatus for burst pilot for a time division multiplex system
US6563803B1 (en) * 1997-11-26 2003-05-13 Qualcomm Incorporated Acoustic echo canceller
US6044339A (en) * 1997-12-02 2000-03-28 Dspc Israel Ltd. Reduced real-time processing in stochastic celp encoding
DE19753697B4 (de) * 1997-12-03 2006-04-27 Siemens Ag Verfahren und Funkstation zur Datenübertragung in einem Kommunikationssystem
US6049765A (en) * 1997-12-22 2000-04-11 Lucent Technologies Inc. Silence compression for recorded voice messages
US6104994A (en) * 1998-01-13 2000-08-15 Conexant Systems, Inc. Method for speech coding under background noise conditions
JPH11215006A (ja) * 1998-01-29 1999-08-06 Olympus Optical Co Ltd ディジタル音声信号の送信装置及び受信装置
US6799159B2 (en) * 1998-02-02 2004-09-28 Motorola, Inc. Method and apparatus employing a vocoder for speech processing
US6381569B1 (en) * 1998-02-04 2002-04-30 Qualcomm Incorporated Noise-compensated speech recognition templates
US6603751B1 (en) * 1998-02-13 2003-08-05 Qualcomm Incorporated Method and system for performing a handoff in a wireless communication system, such as a hard handoff
US6545989B1 (en) 1998-02-19 2003-04-08 Qualcomm Incorporated Transmit gating in a wireless communication system
US6104991A (en) * 1998-02-27 2000-08-15 Lucent Technologies, Inc. Speech encoding and decoding system which modifies encoding and decoding characteristics based on an audio signal
FI113571B (fi) 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
US6028541A (en) * 1998-03-12 2000-02-22 Liquid Audio Inc. Lossless data compression with low complexity
US6043763A (en) * 1998-03-12 2000-03-28 Liquid Audio, Inc. Lossless data compression with low complexity
US6121904A (en) * 1998-03-12 2000-09-19 Liquid Audio, Inc. Lossless data compression with low complexity
US6118392A (en) * 1998-03-12 2000-09-12 Liquid Audio Inc. Lossless data compression with low complexity
US6125348A (en) * 1998-03-12 2000-09-26 Liquid Audio Inc. Lossless data compression with low complexity
US6169906B1 (en) * 1998-03-24 2001-01-02 Motorola, Inc. Method of transmitting messages in a dispatch call
US20030194033A1 (en) 1998-05-21 2003-10-16 Tiedemann Edward G. Method and apparatus for coordinating transmission of short messages with hard handoff searches in a wireless communications system
US6577645B2 (en) 1998-06-03 2003-06-10 Siemens Aktiengesellschaft Method and radio set for transmitting messages
WO1999063769A2 (de) * 1998-06-03 1999-12-09 Siemens Aktiengesellschaft Verfahren und funkgerät zur übertragung von nachrichten
US6141639A (en) * 1998-06-05 2000-10-31 Conexant Systems, Inc. Method and apparatus for coding of signals containing speech and background noise
JP3273599B2 (ja) * 1998-06-19 2002-04-08 沖電気工業株式会社 音声符号化レート選択器と音声符号化装置
US6810377B1 (en) * 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
US6034971A (en) * 1998-06-30 2000-03-07 Motorola, Inc. Method and apparatus for controlling communication system capacity
US6081776A (en) * 1998-07-13 2000-06-27 Lockheed Martin Corp. Speech coding system and method including adaptive finite impulse response filter
DE19833318C2 (de) * 1998-07-24 2001-08-02 Bosch Gmbh Robert Verfahren zur Übertragung von digitalen Nutzdaten
US6163766A (en) * 1998-08-14 2000-12-19 Motorola, Inc. Adaptive rate system and method for wireless communications
US6173254B1 (en) * 1998-08-18 2001-01-09 Denso Corporation, Ltd. Recorded message playback system for a variable bit rate system
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6823303B1 (en) * 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
US6240386B1 (en) 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6449590B1 (en) 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US7117146B2 (en) * 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6330533B2 (en) 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US6798736B1 (en) 1998-09-22 2004-09-28 Qualcomm Incorporated Method and apparatus for transmitting and receiving variable rate data
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6219642B1 (en) 1998-10-05 2001-04-17 Legerity, Inc. Quantization using frequency and mean compensated frequency input data for robust speech recognition
US6347297B1 (en) * 1998-10-05 2002-02-12 Legerity, Inc. Matrix quantization with vector quantization error compensation and neural network postprocessing for robust speech recognition
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
JP3343082B2 (ja) * 1998-10-27 2002-11-11 松下電器産業株式会社 Celp型音声符号化装置
US6754630B2 (en) 1998-11-13 2004-06-22 Qualcomm, Inc. Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation
US6463407B2 (en) 1998-11-13 2002-10-08 Qualcomm Inc. Low bit-rate coding of unvoiced segments of speech
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
US6233549B1 (en) 1998-11-23 2001-05-15 Qualcomm, Inc. Low frequency spectral enhancement system and method
US6289099B1 (en) * 1998-11-30 2001-09-11 Qualcomm Inc. Ringer for satellite user terminals
US6256606B1 (en) * 1998-11-30 2001-07-03 Conexant Systems, Inc. Silence description coding for multi-rate speech codecs
US6512925B1 (en) * 1998-12-03 2003-01-28 Qualcomm, Incorporated Method and apparatus for controlling transmission power while in soft handoff
US6275485B1 (en) * 1998-12-03 2001-08-14 Qualcomm Inc. Noise characterization in a wireless communication system
US6182030B1 (en) 1998-12-18 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Enhanced coding to improve coded communication signals
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6542486B1 (en) * 1998-12-22 2003-04-01 Nortel Networks Limited Multiple technology vocoder and an associated telecommunications network
US6393074B1 (en) 1998-12-31 2002-05-21 Texas Instruments Incorporated Decoding system for variable-rate convolutionally-coded data sequence
US7406098B2 (en) * 1999-01-13 2008-07-29 Qualcomm Incorporated Resource allocation in a communication system supporting application flows having quality of service requirements
US6324509B1 (en) 1999-02-08 2001-11-27 Qualcomm Incorporated Method and apparatus for accurate endpointing of speech in the presence of noise
US6330247B1 (en) 1999-02-08 2001-12-11 Qualcomm Incorporated Communication protocol between a communication device and an external accessory
US6411926B1 (en) 1999-02-08 2002-06-25 Qualcomm Incorporated Distributed voice recognition system
US6574596B2 (en) 1999-02-08 2003-06-03 Qualcomm Incorporated Voice recognition rejection scheme
AU3589100A (en) * 1999-02-08 2000-08-25 Qualcomm Incorporated Speech synthesizer based on variable rate speech coding
US6226607B1 (en) 1999-02-08 2001-05-01 Qualcomm Incorporated Method and apparatus for eighth-rate random number generation for speech coders
US6587446B2 (en) * 1999-02-11 2003-07-01 Qualcomm Incorporated Handoff in a wireless communication system
US6260009B1 (en) 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
US6449592B1 (en) 1999-02-26 2002-09-10 Qualcomm Incorporated Method and apparatus for tracking the phase of a quasi-periodic signal
US6397177B1 (en) * 1999-03-10 2002-05-28 Samsung Electronics, Co., Ltd. Speech-encoding rate decision apparatus and method in a variable rate
US6088347A (en) * 1999-03-10 2000-07-11 Massachusetts Institute Of Technology Variable chip rate code-division multiple access
US6233552B1 (en) * 1999-03-12 2001-05-15 Comsat Corporation Adaptive post-filtering technique based on the Modified Yule-Walker filter
US6519479B1 (en) 1999-03-31 2003-02-11 Qualcomm Inc. Spoken user interface for speech-enabled devices
CA2371958C (en) * 1999-04-12 2006-07-25 Samsung Electronics Co., Ltd. Apparatus and method for gated transmission in a cdma communication system
US7058573B1 (en) * 1999-04-20 2006-06-06 Nuance Communications Inc. Speech recognition system to selectively utilize different speech recognition techniques over multiple speech recognition passes
US6260017B1 (en) 1999-05-07 2001-07-10 Qualcomm Inc. Multipulse interpolative coding of transition speech frames
US6766295B1 (en) 1999-05-10 2004-07-20 Nuance Communications Adaptation of a speech recognition system across multiple remote sessions with a speaker
US6661832B1 (en) * 1999-05-11 2003-12-09 Qualcomm Incorporated System and method for providing an accurate estimation of received signal interference for use in wireless communications systems
US6954727B1 (en) * 1999-05-28 2005-10-11 Koninklijke Philips Electronics N.V. Reducing artifact generation in a vocoder
US6397175B1 (en) 1999-07-19 2002-05-28 Qualcomm Incorporated Method and apparatus for subsampling phase spectrum information
US6324503B1 (en) 1999-07-19 2001-11-27 Qualcomm Incorporated Method and apparatus for providing feedback from decoder to encoder to improve performance in a predictive speech coder under frame erasure conditions
US6330532B1 (en) 1999-07-19 2001-12-11 Qualcomm Incorporated Method and apparatus for maintaining a target bit rate in a speech coder
US6393394B1 (en) 1999-07-19 2002-05-21 Qualcomm Incorporated Method and apparatus for interleaving line spectral information quantization methods in a speech coder
US6324505B1 (en) * 1999-07-19 2001-11-27 Qualcomm Incorporated Amplitude quantization scheme for low-bit-rate speech coders
US6496706B1 (en) 1999-07-23 2002-12-17 Qualcomm Incorporated Method and system for transmit gating in a wireless communication system
US6704328B1 (en) * 1999-07-26 2004-03-09 Nortel Networks, Limited Signalling scheme and messaging structure to support the smoothing of large bit rate transmissions
US6603752B1 (en) * 1999-07-29 2003-08-05 Ahmed Saifuddin Method and system for controlling transmission energy in a variable rate gated communication system
US6658112B1 (en) 1999-08-06 2003-12-02 General Dynamics Decision Systems, Inc. Voice decoder and method for detecting channel errors using spectral energy evolution
US6633552B1 (en) 1999-08-06 2003-10-14 Qualcomm Incorporated Method and apparatus for determining the closed loop power control set point in a wireless packet data communication system
US6597667B1 (en) 1999-08-18 2003-07-22 Qualcomm Incorporated Network based muting of a cellular telephone
US6493329B1 (en) * 1999-08-23 2002-12-10 Qualcomm Incorporated Adaptive channel estimation in a wireless communication system
US8064409B1 (en) 1999-08-25 2011-11-22 Qualcomm Incorporated Method and apparatus using a multi-carrier forward link in a wireless communication system
US6426971B1 (en) 1999-09-13 2002-07-30 Qualcomm Incorporated System and method for accurately predicting signal to interference and noise ratio to improve communications system performance
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6574593B1 (en) 1999-09-22 2003-06-03 Conexant Systems, Inc. Codebook tables for encoding and decoding
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6708024B1 (en) * 1999-09-22 2004-03-16 Legerity, Inc. Method and apparatus for generating comfort noise
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
US6581032B1 (en) 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
US7054809B1 (en) * 1999-09-22 2006-05-30 Mindspeed Technologies, Inc. Rate selection method for selectable mode vocoder
AU2003262451B2 (en) * 1999-09-22 2006-01-19 Macom Technology Solutions Holdings, Inc. Multimode speech encoder
US6959274B1 (en) 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
AU766830B2 (en) * 1999-09-22 2003-10-23 Macom Technology Solutions Holdings, Inc. Multimode speech encoder
US6496798B1 (en) * 1999-09-30 2002-12-17 Motorola, Inc. Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message
US6772126B1 (en) * 1999-09-30 2004-08-03 Motorola, Inc. Method and apparatus for transferring low bit rate digital voice messages using incremental messages
US6621804B1 (en) 1999-10-07 2003-09-16 Qualcomm Incorporated Method and apparatus for predicting favored supplemental channel transmission slots using transmission power measurements of a fundamental channel
US6850506B1 (en) 1999-10-07 2005-02-01 Qualcomm Incorporated Forward-link scheduling in a wireless communication system
US7522631B1 (en) * 1999-10-26 2009-04-21 Qualcomm, Incorporated Method and apparatus for efficient data transmission control in a wireless voice-over-data communication system
US6463274B1 (en) * 1999-10-26 2002-10-08 Denso Corporation Multiple class of service determination for digital cellular telephones
US6438518B1 (en) 1999-10-28 2002-08-20 Qualcomm Incorporated Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions
US6496794B1 (en) * 1999-11-22 2002-12-17 Motorola, Inc. Method and apparatus for seamless multi-rate speech coding
BR0006803A (pt) * 1999-12-10 2001-12-11 Lucent Technologies Inc Sistema e método para reduzir retardo de fala emelhorar a qualidade de fala utilizando meiosblocos
US6772112B1 (en) 1999-12-10 2004-08-03 Lucent Technologies Inc. System and method to reduce speech delay and improve voice quality using half speech blocks
US7574351B2 (en) * 1999-12-14 2009-08-11 Texas Instruments Incorporated Arranging CELP information of one frame in a second packet
US6745024B1 (en) 2000-01-10 2004-06-01 Qualcomm Incorporated System and method for preparing and sending an electronic mail communication using a wireless communications device
US6510409B1 (en) * 2000-01-18 2003-01-21 Conexant Systems, Inc. Intelligent discontinuous transmission and comfort noise generation scheme for pulse code modulation speech coders
US7127390B1 (en) * 2000-02-08 2006-10-24 Mindspeed Technologies, Inc. Rate determination coding
EP1126651A1 (en) * 2000-02-16 2001-08-22 Lucent Technologies Inc. Link adaptation for RT-EGPRS
US6721368B1 (en) 2000-03-04 2004-04-13 Qualcomm Incorporated Transmitter architectures for communications systems
US6584438B1 (en) 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
ES2287122T3 (es) 2000-04-24 2007-12-16 Qualcomm Incorporated Procedimiento y aparato para cuantificar de manera predictiva habla sonora.
US6980527B1 (en) 2000-04-25 2005-12-27 Cwill Telecommunications, Inc. Smart antenna CDMA wireless communication system
US6285682B1 (en) * 2000-05-01 2001-09-04 Motorola, Inc. Method and apparatus for determining the frame rate of a frame
US7080009B2 (en) * 2000-05-01 2006-07-18 Motorola, Inc. Method and apparatus for reducing rate determination errors and their artifacts
FI115329B (fi) 2000-05-08 2005-04-15 Nokia Corp Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin
US7089181B2 (en) * 2001-05-30 2006-08-08 Intel Corporation Enhancing the intelligibility of received speech in a noisy environment
US6954745B2 (en) 2000-06-02 2005-10-11 Canon Kabushiki Kaisha Signal processing system
US7072833B2 (en) 2000-06-02 2006-07-04 Canon Kabushiki Kaisha Speech processing system
US7035790B2 (en) 2000-06-02 2006-04-25 Canon Kabushiki Kaisha Speech processing system
US7010483B2 (en) 2000-06-02 2006-03-07 Canon Kabushiki Kaisha Speech processing system
US6735563B1 (en) 2000-07-13 2004-05-11 Qualcomm, Inc. Method and apparatus for constructing voice templates for a speaker-independent voice recognition system
US6671669B1 (en) * 2000-07-18 2003-12-30 Qualcomm Incorporated combined engine system and method for voice recognition
US6510142B1 (en) 2000-07-21 2003-01-21 Motorola, Inc. Method and apparatus for reduced reversed traffic in a cellular telephone system
US6856954B1 (en) * 2000-07-28 2005-02-15 Mindspeed Technologies, Inc. Flexible variable rate vocoder for wireless communication systems
US6728669B1 (en) * 2000-08-07 2004-04-27 Lucent Technologies Inc. Relative pulse position in celp vocoding
EP1308927B9 (en) * 2000-08-09 2009-02-25 Sony Corporation Voice data processing device and processing method
US6477502B1 (en) 2000-08-22 2002-11-05 Qualcomm Incorporated Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system
US6842733B1 (en) 2000-09-15 2005-01-11 Mindspeed Technologies, Inc. Signal processing system for filtering spectral content of a signal for speech coding
US6937979B2 (en) * 2000-09-15 2005-08-30 Mindspeed Technologies, Inc. Coding based on spectral content of a speech signal
US6850884B2 (en) * 2000-09-15 2005-02-01 Mindspeed Technologies, Inc. Selection of coding parameters based on spectral content of a speech signal
US7133823B2 (en) * 2000-09-15 2006-11-07 Mindspeed Technologies, Inc. System for an adaptive excitation pattern for speech coding
US6760882B1 (en) 2000-09-19 2004-07-06 Intel Corporation Mode selection for data transmission in wireless communication channels based on statistical parameters
US6802035B2 (en) * 2000-09-19 2004-10-05 Intel Corporation System and method of dynamically optimizing a transmission mode of wirelessly transmitted information
US7068683B1 (en) 2000-10-25 2006-06-27 Qualcomm, Incorporated Method and apparatus for high rate packet data and low delay data transmissions
US7171355B1 (en) 2000-10-25 2007-01-30 Broadcom Corporation Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
US6973098B1 (en) 2000-10-25 2005-12-06 Qualcomm, Incorporated Method and apparatus for determining a data rate in a high rate packet data wireless communications system
EP1206104B1 (en) * 2000-11-09 2006-07-19 Koninklijke KPN N.V. Measuring a talking quality of a telephone link in a telecommunications network
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
US6999430B2 (en) * 2000-11-30 2006-02-14 Qualcomm Incorporated Method and apparatus for transmitting data traffic on a wireless communication channel
US6804218B2 (en) 2000-12-04 2004-10-12 Qualcomm Incorporated Method and apparatus for improved detection of rate errors in variable rate receivers
US7472059B2 (en) * 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
US7505594B2 (en) * 2000-12-19 2009-03-17 Qualcomm Incorporated Discontinuous transmission (DTX) controller system and method
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US7346918B2 (en) 2000-12-27 2008-03-18 Z-Band, Inc. Intelligent device system and method for distribution of digital signals on a wideband signal distribution system
WO2002054601A1 (en) 2000-12-29 2002-07-11 Morphics Technology, Inc. Channel codec processor configurable for multiple wireless communications standards
US7113522B2 (en) * 2001-01-24 2006-09-26 Qualcomm, Incorporated Enhanced conversion of wideband signals to narrowband signals
US7062445B2 (en) * 2001-01-26 2006-06-13 Microsoft Corporation Quantization loop with heuristic approach
US7120134B2 (en) 2001-02-15 2006-10-10 Qualcomm, Incorporated Reverse link channel architecture for a wireless communication system
US20040204935A1 (en) * 2001-02-21 2004-10-14 Krishnasamy Anandakumar Adaptive voice playout in VOP
US6760587B2 (en) 2001-02-23 2004-07-06 Qualcomm Incorporated Forward-link scheduling in a wireless communication system during soft and softer handoff
US7289461B2 (en) 2001-03-15 2007-10-30 Qualcomm Incorporated Communications using wideband terminals
US20020181546A1 (en) * 2001-03-23 2002-12-05 Odenwalder Joseph P. Preamble channels
US6760576B2 (en) 2001-03-27 2004-07-06 Qualcomm Incorporated Method and apparatus for enhanced rate determination in high data rate wireless communication systems
US8199696B2 (en) * 2001-03-29 2012-06-12 Qualcomm Incorporated Method and apparatus for power control in a wireless communication system
US7230941B2 (en) 2001-04-26 2007-06-12 Qualcomm Incorporated Preamble channel decoding
US6625172B2 (en) 2001-04-26 2003-09-23 Joseph P. Odenwalder Rescheduling scheduled transmissions
JP4591939B2 (ja) * 2001-05-15 2010-12-01 Kddi株式会社 適応的符号化伝送装置および受信装置
US6990137B2 (en) * 2001-05-17 2006-01-24 Qualcomm, Incorporated System and method for received signal prediction in wireless communications systems
US7170924B2 (en) * 2001-05-17 2007-01-30 Qualcomm, Inc. System and method for adjusting combiner weights using an adaptive algorithm in wireless communications system
JP3859462B2 (ja) * 2001-05-18 2006-12-20 株式会社東芝 予測パラメータ分析装置および予測パラメータ分析方法
US6789059B2 (en) 2001-06-06 2004-09-07 Qualcomm Incorporated Reducing memory requirements of a codebook vector search
GB2387304B (en) 2001-06-28 2004-07-07 Samsung Electronics Co Ltd Apparatus and method for decoding TFCI bits for a hard split mode in a CDMA mobile communication system
US7489655B2 (en) * 2001-07-06 2009-02-10 Qualcomm, Incorporated Method and apparatus for predictive scheduling in a bi-directional communication system
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
US7110942B2 (en) * 2001-08-14 2006-09-19 Broadcom Corporation Efficient excitation quantization in a noise feedback coding system using correlation techniques
EP1425562B1 (en) * 2001-08-17 2007-01-10 Broadcom Corporation Improved bit error concealment methods for speech coding
US7162415B2 (en) * 2001-11-06 2007-01-09 The Regents Of The University Of California Ultra-narrow bandwidth voice coding
US7453801B2 (en) * 2001-11-08 2008-11-18 Qualcomm Incorporated Admission control and resource allocation in a communication system supporting application flows having quality of service requirements
CN1640045A (zh) * 2001-12-05 2005-07-13 高通股份有限公司 调整通信系统服务质量的系统与方法
US7146313B2 (en) * 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7027982B2 (en) * 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
GB2383239B (en) * 2001-12-15 2004-03-17 Motorola Inc A method and apparatus for transmitting data
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
JP3778087B2 (ja) * 2002-01-18 2006-05-24 富士ゼロックス株式会社 データ符号化装置及びデータ復号装置
US7313520B2 (en) * 2002-03-20 2007-12-25 The Directv Group, Inc. Adaptive variable bit rate audio compression encoding
US6957183B2 (en) * 2002-03-20 2005-10-18 Qualcomm Inc. Method for robust voice recognition by analyzing redundant features of source signal
US6980695B2 (en) * 2002-06-28 2005-12-27 Microsoft Corporation Rate allocation for mixed content video
US7321559B2 (en) * 2002-06-28 2008-01-22 Lucent Technologies Inc System and method of noise reduction in receiving wireless transmission of packetized audio signals
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US8090577B2 (en) * 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
JP2004151123A (ja) * 2002-10-23 2004-05-27 Nec Corp 符号変換方法、符号変換装置、プログラム及びその記憶媒体
US7602722B2 (en) * 2002-12-04 2009-10-13 Nortel Networks Limited Mobile assisted fast scheduling for the reverse link
GB2396271B (en) * 2002-12-10 2005-08-10 Motorola Inc A user terminal and method for voice communication
US7698132B2 (en) * 2002-12-17 2010-04-13 Qualcomm Incorporated Sub-sampled excitation waveform codebooks
US7120447B1 (en) * 2003-02-24 2006-10-10 Nortel Networks Limited Selectable mode vocoder management algorithm for CDMA based networks
US6965859B2 (en) * 2003-02-28 2005-11-15 Xvd Corporation Method and apparatus for audio compression
KR100480341B1 (ko) * 2003-03-13 2005-03-31 한국전자통신연구원 광대역 저전송률 음성 신호의 부호화기
US7009999B2 (en) * 2003-03-28 2006-03-07 Qualcomm Incorporated Selective variable rate encoding to regulate data frame size
KR20050007977A (ko) * 2003-07-12 2005-01-21 삼성전자주식회사 이동 통신 시스템에서의 보코더의 모드 및 전송율 제어 방법
US7577756B2 (en) 2003-07-15 2009-08-18 Special Devices, Inc. Dynamically-and continuously-variable rate, asynchronous data transfer
US7383180B2 (en) * 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques
US7609763B2 (en) * 2003-07-18 2009-10-27 Microsoft Corporation Advanced bi-directional predictive coding of video frames
US7343291B2 (en) 2003-07-18 2008-03-11 Microsoft Corporation Multi-pass variable bitrate media encoding
US7146309B1 (en) 2003-09-02 2006-12-05 Mindspeed Technologies, Inc. Deriving seed values to generate excitation values in a speech coder
US7613606B2 (en) * 2003-10-02 2009-11-03 Nokia Corporation Speech codecs
US7379875B2 (en) * 2003-10-24 2008-05-27 Microsoft Corporation Systems and methods for generating audio thumbnails
US7505764B2 (en) * 2003-10-28 2009-03-17 Motorola, Inc. Method for retransmitting a speech packet
US20050147131A1 (en) * 2003-12-29 2005-07-07 Nokia Corporation Low-rate in-band data channel using CELP codewords
KR100629997B1 (ko) * 2004-02-26 2006-09-27 엘지전자 주식회사 오디오 신호의 인코딩 방법
US8473286B2 (en) * 2004-02-26 2013-06-25 Broadcom Corporation Noise feedback coding system and method for providing generalized noise shaping within a simple filter structure
WO2005086138A1 (ja) * 2004-03-05 2005-09-15 Matsushita Electric Industrial Co., Ltd. エラー隠蔽装置およびエラー隠蔽方法
JP2005337573A (ja) 2004-05-26 2005-12-08 Sanden Corp 熱交換器
EP1768106B8 (en) * 2004-07-23 2017-07-19 III Holdings 12, LLC Audio encoding device and audio encoding method
US8046217B2 (en) * 2004-08-27 2011-10-25 Panasonic Corporation Geometric calculation of absolute phases for parametric stereo decoding
US8331385B2 (en) 2004-08-30 2012-12-11 Qualcomm Incorporated Method and apparatus for flexible packet selection in a wireless communication system
SE528213C3 (sv) * 2004-09-30 2006-10-31 Ericsson Telefon Ab L M Förfaranden och arrangemang för adaptiva trösklar vid val av kodek
SE0402372D0 (sv) 2004-09-30 2004-09-30 Ericsson Telefon Ab L M Signal coding
US8085678B2 (en) 2004-10-13 2011-12-27 Qualcomm Incorporated Media (voice) playback (de-jitter) buffer adjustments based on air interface
US7983679B2 (en) * 2004-11-22 2011-07-19 Motorola Mobility, Inc. Method and apparatus for inter-system active handoff of a hybrid subscriber unit
US7697480B2 (en) * 2004-11-22 2010-04-13 Motorola, Inc Method and apparatus for inter-system active handoff of a hybrid subscriber unit
US8102872B2 (en) * 2005-02-01 2012-01-24 Qualcomm Incorporated Method for discontinuous transmission and accurate reproduction of background noise information
US20060224381A1 (en) * 2005-04-04 2006-10-05 Nokia Corporation Detecting speech frames belonging to a low energy sequence
US20060241937A1 (en) * 2005-04-21 2006-10-26 Ma Changxue C Method and apparatus for automatically discriminating information bearing audio segments and background noise audio segments
US7983301B2 (en) * 2005-06-24 2011-07-19 O2Micro International, Ltd. Method for extended transmission capabilities of short message service
WO2007003231A1 (en) * 2005-06-30 2007-01-11 Freescale Semiconductor, Inc Vector crc computation on dsp
US20070005347A1 (en) * 2005-06-30 2007-01-04 Kotzin Michael D Method and apparatus for data frame construction
JP5035816B2 (ja) * 2005-07-14 2012-09-26 一般財団法人電力中央研究所 細孔内付着液体残留量推定方法
US7542421B2 (en) * 2005-09-09 2009-06-02 Tropos Networks Adaptive control of transmission power and data rates of transmission links between access nodes of a mesh network
CN1964244B (zh) * 2005-11-08 2010-04-07 厦门致晟科技有限公司 一种用声码器收发数字信号的方法
TWI358056B (en) * 2005-12-02 2012-02-11 Qualcomm Inc Systems, methods, and apparatus for frequency-doma
JP4971351B2 (ja) * 2005-12-05 2012-07-11 クゥアルコム・インコーポレイテッド トーンコンポーネントの検出のためのシステム、方法および装置
KR100744542B1 (ko) * 2005-12-08 2007-08-01 한국전자통신연구원 가변대역 멀티코덱 QoS 제어 장치 및 방법
US8346544B2 (en) * 2006-01-20 2013-01-01 Qualcomm Incorporated Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision
US8032369B2 (en) * 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US8090573B2 (en) * 2006-01-20 2012-01-03 Qualcomm Incorporated Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision
JP4816115B2 (ja) * 2006-02-08 2011-11-16 カシオ計算機株式会社 音声符号化装置及び音声符号化方法
US8036242B2 (en) * 2006-02-15 2011-10-11 Qualcomm Incorporated Dynamic capacity operating point management for a vocoder in an access terminal
US7720499B2 (en) * 2006-02-27 2010-05-18 Tropos Networks, Inc. Regulation of transmission power control in mitigate self interference by optimizing link transmission parameters in a wireless network
JP4771835B2 (ja) * 2006-03-06 2011-09-14 株式会社リコー トナー及び画像形成方法
FR2898443A1 (fr) * 2006-03-13 2007-09-14 France Telecom Procede de codage d'un signal audio source, dispositif de codage, procede et dispositif de decodage, signal, produits programme d'ordinateur correspondants
US7778828B2 (en) * 2006-03-15 2010-08-17 Sasken Communication Technologies Ltd. Method and system for automatic gain control of a speech signal
US8392176B2 (en) * 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
DE102006025042B4 (de) * 2006-05-26 2008-08-14 Infineon Technologies Ag Datenratenfehler-tolerante Synchronisation eines digitalen Empfängers
US8036186B2 (en) * 2006-07-26 2011-10-11 Tropos Networks, Inc. Adaptively setting transmission power levels of nodes within a wireless mesh network
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
KR100883652B1 (ko) * 2006-08-03 2009-02-18 삼성전자주식회사 음성 구간 검출 방법 및 장치, 및 이를 이용한 음성 인식시스템
EP2062255B1 (en) * 2006-09-13 2010-03-31 Telefonaktiebolaget LM Ericsson (PUBL) Methods and arrangements for a speech/audio sender and receiver
WO2008048807A2 (en) 2006-10-06 2008-04-24 Viasat, Inc. Forward and reverse calibration for ground-based beamforming
US7877253B2 (en) * 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
CA2663904C (en) * 2006-10-10 2014-05-27 Qualcomm Incorporated Method and apparatus for encoding and decoding audio signals
KR100833499B1 (ko) * 2006-10-27 2008-05-29 한국전자통신연구원 가변 대역 멀티 코덱의 음성 품질 측정 장치 및 방법
CN100587186C (zh) * 2006-11-02 2010-02-03 邹家祥 一种保温组合墙板构筑墙体的方法
US8279889B2 (en) * 2007-01-04 2012-10-02 Qualcomm Incorporated Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate
US8254455B2 (en) * 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
US20090198500A1 (en) * 2007-08-24 2009-08-06 Qualcomm Incorporated Temporal masking in audio coding based on spectral dynamics in frequency sub-bands
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
US20090094026A1 (en) * 2007-10-03 2009-04-09 Binshi Cao Method of determining an estimated frame energy of a communication
US8015002B2 (en) 2007-10-24 2011-09-06 Qnx Software Systems Co. Dynamic noise reduction using linear model fitting
US8606566B2 (en) * 2007-10-24 2013-12-10 Qnx Software Systems Limited Speech enhancement through partial speech reconstruction
US8326617B2 (en) 2007-10-24 2012-12-04 Qnx Software Systems Limited Speech enhancement with minimum gating
JP5229234B2 (ja) * 2007-12-18 2013-07-03 富士通株式会社 非音声区間検出方法及び非音声区間検出装置
KR101570550B1 (ko) * 2008-03-14 2015-11-19 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 부호화 장치, 복호 장치 및 이러한 방법
US8325800B2 (en) 2008-05-07 2012-12-04 Microsoft Corporation Encoding streaming media as a high bit rate layer, a low bit rate layer, and one or more intermediate bit rate layers
US8379851B2 (en) 2008-05-12 2013-02-19 Microsoft Corporation Optimized client side rate control and indexed file layout for streaming media
US8370887B2 (en) 2008-05-30 2013-02-05 Microsoft Corporation Media streaming with enhanced seek operation
US7948887B2 (en) * 2008-06-24 2011-05-24 Microsoft Corporation Network bandwidth measurement
US8144602B2 (en) * 2008-08-06 2012-03-27 Jds Uniphase Corporation Network load tester with real-time detection and recording
US8265140B2 (en) 2008-09-30 2012-09-11 Microsoft Corporation Fine-grained client-side control of scalable media delivery
US8964692B2 (en) * 2008-11-10 2015-02-24 Qualcomm Incorporated Spectrum sensing of bluetooth using a sequence of energy detection measurements
EP2211335A1 (en) * 2009-01-21 2010-07-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal
US8189666B2 (en) 2009-02-02 2012-05-29 Microsoft Corporation Local picture identifier and computation of co-located information
WO2010140940A1 (en) * 2009-06-04 2010-12-09 Telefonaktiebolaget Lm Ericsson (Publ) A method and arrangement for estimating the quality degradation of a processed signal
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
CN102483926B (zh) 2009-07-27 2013-07-24 Scti控股公司 在处理语音信号中通过把语音作为目标和忽略噪声以降噪的系统及方法
US8811200B2 (en) 2009-09-22 2014-08-19 Qualcomm Incorporated Physical layer metrics to support adaptive station-dependent channel state information feedback rate in multi-user communication systems
EP2491559B1 (en) * 2009-10-19 2014-12-10 Telefonaktiebolaget LM Ericsson (publ) Method and background estimator for voice activity detection
KR101761629B1 (ko) * 2009-11-24 2017-07-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8781822B2 (en) * 2009-12-22 2014-07-15 Qualcomm Incorporated Audio and speech processing with optimal bit-allocation for constant bit rate applications
US20110196673A1 (en) * 2010-02-11 2011-08-11 Qualcomm Incorporated Concealing lost packets in a sub-band coding decoder
US8374858B2 (en) * 2010-03-09 2013-02-12 Dts, Inc. Scalable lossless audio codec and authoring tool
US9082416B2 (en) * 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
CA2827266C (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
CA2903681C (en) 2011-02-14 2017-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
PL2661745T3 (pl) * 2011-02-14 2015-09-30 Fraunhofer Ges Forschung Urządzenie i sposób do ukrywania błędów w zunifikowanym kodowaniu mowy i audio
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
MX2013009345A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio.
JP5712288B2 (ja) 2011-02-14 2015-05-07 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 重複変換を使用した情報信号表記
MX2013009346A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral.
ES2529025T3 (es) 2011-02-14 2015-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio decodificada en un dominio espectral
EP4243017A3 (en) 2011-02-14 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
US8762136B2 (en) * 2011-05-03 2014-06-24 Lsi Corporation System and method of speech compression using an inter frame parameter correlation
US8990074B2 (en) * 2011-05-24 2015-03-24 Qualcomm Incorporated Noise-robust speech coding mode classification
FR2977969A1 (fr) * 2011-07-12 2013-01-18 France Telecom Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee
US9208796B2 (en) * 2011-08-22 2015-12-08 Genband Us Llc Estimation of speech energy based on code excited linear prediction (CELP) parameters extracted from a partially-decoded CELP-encoded bit stream and applications of same
EP2798631B1 (en) * 2011-12-21 2016-03-23 Huawei Technologies Co., Ltd. Adaptively encoding pitch lag for voiced speech
US9111531B2 (en) * 2012-01-13 2015-08-18 Qualcomm Incorporated Multiple coding mode signal classification
EP2830062B1 (en) 2012-03-21 2019-11-20 Samsung Electronics Co., Ltd. Method and apparatus for high-frequency encoding/decoding for bandwidth extension
ES2588156T3 (es) 2012-12-21 2016-10-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generación de ruido de confort con alta resolución espectro-temporal en transmisión discontinua de señales de audio
JP6335190B2 (ja) 2012-12-21 2018-05-30 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加
EP3217398B1 (en) 2013-04-05 2019-08-14 Dolby International AB Advanced quantizer
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
US9640185B2 (en) * 2013-12-12 2017-05-02 Motorola Solutions, Inc. Method and apparatus for enhancing the modulation index of speech sounds passed through a digital vocoder
US9570095B1 (en) * 2014-01-17 2017-02-14 Marvell International Ltd. Systems and methods for instantaneous noise estimation
US9721580B2 (en) * 2014-03-31 2017-08-01 Google Inc. Situation dependent transient suppression
CN105023579A (zh) * 2014-04-30 2015-11-04 中国电信股份有限公司 语音通信中语音编码实现方法、装置和通信终端
EP2980796A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
CN104833105A (zh) * 2015-05-28 2015-08-12 芜湖美的厨卫电器制造有限公司 热水器和热水器系统
US11631421B2 (en) * 2015-10-18 2023-04-18 Solos Technology Limited Apparatuses and methods for enhanced speech recognition in variable environments
US11227214B2 (en) 2017-11-14 2022-01-18 Advanced Micro Devices, Inc. Memory bandwidth reduction techniques for low power convolutional neural network inference applications
EA038803B1 (ru) * 2017-12-25 2021-10-21 Федеральное государственное унитарное предприятие "Всероссийский научно-исследовательский институт автоматики им. Н.Л. Духова" Способ адаптивной цифровой фильтрации импульсных помех и фильтр для его реализации
US11948073B2 (en) 2018-04-20 2024-04-02 Advanced Micro Devices, Inc. Machine learning inference engine scalability
RU2691122C1 (ru) * 2018-06-13 2019-06-11 Ордена трудового Красного Знамени федеральное государственное бюджетное образовательное учреждение высшего образования "Московский технический университет связи и информатики" (МТУСИ) Способ и устройство компандирования звуковых вещательных сигналов
US11775799B2 (en) 2018-08-02 2023-10-03 Advanced Micro Devices, Inc. Runtime extension for neural network training with heterogeneous memory
US11769041B2 (en) 2018-10-31 2023-09-26 Advanced Micro Devices, Inc. Low latency long short-term memory inference with sequence interleaving
US11063645B2 (en) 2018-12-18 2021-07-13 XCOM Labs, Inc. Methods of wirelessly communicating with a group of devices
US10756795B2 (en) 2018-12-18 2020-08-25 XCOM Labs, Inc. User equipment with cellular link and peer-to-peer link
CN111338974A (zh) 2018-12-19 2020-06-26 超威半导体公司 用于矩阵数学指令集的图块化算法
CN111353575A (zh) 2018-12-20 2020-06-30 超威半导体公司 用于卷积神经网络的图块化格式
US11330649B2 (en) 2019-01-25 2022-05-10 XCOM Labs, Inc. Methods and systems of multi-link peer-to-peer communications
US10756767B1 (en) 2019-02-05 2020-08-25 XCOM Labs, Inc. User equipment for wirelessly communicating cellular signal with another user equipment
CN111723918A (zh) 2019-03-18 2020-09-29 超威半导体公司 用于卷积内核的自动生成和调谐工具
US11610142B2 (en) 2019-05-28 2023-03-21 Ati Technologies Ulc Safety monitor for image misclassification
US11210199B2 (en) 2019-05-31 2021-12-28 Ati Technologies Ulc Safety monitor for invalid image transform
US11250867B1 (en) * 2019-10-08 2022-02-15 Rockwell Collins, Inc. Incorporating data into a voice signal with zero overhead
JP7332890B2 (ja) 2019-11-19 2023-08-24 アイコム株式会社 音声通信システム、音声通信方法、および、音声通信プログラム
US11023390B1 (en) * 2020-03-27 2021-06-01 Arm Limited Resizing circuitry
CN112767953B (zh) * 2020-06-24 2024-01-23 腾讯科技(深圳)有限公司 语音编码方法、装置、计算机设备和存储介质

Family Cites Families (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US32580A (en) * 1861-06-18 Water-elevatok
US3633107A (en) * 1970-06-04 1972-01-04 Bell Telephone Labor Inc Adaptive signal processor for diversity radio receivers
JPS5017711A (ja) * 1973-06-15 1975-02-25
US3988674A (en) * 1975-03-17 1976-10-26 Communications Satellite Corporation (Comsat) Frame synchronization in speech predictive encoded communication system
US4076958A (en) * 1976-09-13 1978-02-28 E-Systems, Inc. Signal synthesizer spectrum contour scaler
US4214125A (en) * 1977-01-21 1980-07-22 Forrest S. Mozer Method and apparatus for speech synthesizing
CA1123955A (en) * 1978-03-30 1982-05-18 Tetsu Taguchi Speech analysis and synthesis apparatus
DE3023375C1 (ja) * 1980-06-23 1987-12-03 Siemens Ag, 1000 Berlin Und 8000 Muenchen, De
US4379949A (en) * 1981-08-10 1983-04-12 Motorola, Inc. Method of and means for variable-rate coding of LPC parameters
JPS6011360B2 (ja) * 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
EP0111612B1 (fr) * 1982-11-26 1987-06-24 International Business Machines Corporation Procédé et dispositif de codage d'un signal vocal
DE3370423D1 (en) * 1983-06-07 1987-04-23 Ibm Process for activity detection in a voice transmission system
US4672670A (en) * 1983-07-26 1987-06-09 Advanced Micro Devices, Inc. Apparatus and methods for coding, decoding, analyzing and synthesizing a signal
EP0163829B1 (en) * 1984-03-21 1989-08-23 Nippon Telegraph And Telephone Corporation Speech signal processing system
IT1179803B (it) * 1984-10-30 1987-09-16 Cselt Centro Studi Lab Telecom Metodo e dispositivo per la correzione di errori causati da rumore di tipo impulsivo su segnali vocali codificati con bassa velocita di ci fra e trasmessi su canali di comunicazione radio
US4856068A (en) * 1985-03-18 1989-08-08 Massachusetts Institute Of Technology Audio pre-processing methods and apparatus
US4937873A (en) * 1985-03-18 1990-06-26 Massachusetts Institute Of Technology Computationally efficient sine wave synthesis for acoustic waveform processing
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4831636A (en) * 1985-06-28 1989-05-16 Fujitsu Limited Coding transmission equipment for carrying out coding with adaptive quantization
US4827517A (en) * 1985-12-26 1989-05-02 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
CA1299750C (en) * 1986-01-03 1992-04-28 Ira Alan Gerson Optimal method of data reduction in a speech recognition system
US4797929A (en) * 1986-01-03 1989-01-10 Motorola, Inc. Word recognition in a speech recognition system using data reduced word templates
JPH0748695B2 (ja) * 1986-05-23 1995-05-24 株式会社日立製作所 音声符号化方式
US4899384A (en) * 1986-08-25 1990-02-06 Ibm Corporation Table controlled dynamic bit allocation in a variable rate sub-band speech coder
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
US4903301A (en) * 1987-02-27 1990-02-20 Hitachi, Ltd. Method and system for transmitting variable rate speech signal
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US5202953A (en) * 1987-04-08 1993-04-13 Nec Corporation Multi-pulse type coding system with correlation calculation by backward-filtering operation for multi-pulse searching
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
US4831624A (en) * 1987-06-04 1989-05-16 Motorola, Inc. Error detection method for sub-band coding
US4802171A (en) * 1987-06-04 1989-01-31 Motorola, Inc. Method for error correction in digitally encoded speech
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
WO1989001992A1 (en) * 1987-09-02 1989-03-09 Moltech Invent S.A. A composite ceramic/metal material
US4811404A (en) * 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
US4852179A (en) * 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
US4896361A (en) * 1988-01-07 1990-01-23 Motorola, Inc. Digital speech coder having improved vector excitation source
DE3871369D1 (de) * 1988-03-08 1992-06-25 Ibm Verfahren und einrichtung zur sprachkodierung mit niedriger datenrate.
EP0331858B1 (en) * 1988-03-08 1993-08-25 International Business Machines Corporation Multi-rate voice encoding method and device
US5023910A (en) * 1988-04-08 1991-06-11 At&T Bell Laboratories Vector quantization in a harmonic speech coding arrangement
US4864561A (en) * 1988-06-20 1989-09-05 American Telephone And Telegraph Company Technique for improved subjective performance in a communication system using attenuated noise-fill
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
US5077798A (en) * 1988-09-28 1991-12-31 Hitachi, Ltd. Method and system for voice coding based on vector quantization
EP0364647B1 (en) * 1988-10-19 1995-02-22 International Business Machines Corporation Improvement to vector quantizing coder
NL8901032A (nl) * 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
JP3033060B2 (ja) * 1988-12-22 2000-04-17 国際電信電話株式会社 音声予測符号化・復号化方式
CA2005115C (en) * 1989-01-17 1997-04-22 Juin-Hwey Chen Low-delay code-excited linear predictive coder for speech or audio
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
DE68916944T2 (de) * 1989-04-11 1995-03-16 Ibm Verfahren zur schnellen Bestimmung der Grundfrequenz in Sprachcodierern mit langfristiger Prädiktion.
US5060269A (en) * 1989-05-18 1991-10-22 General Electric Company Hybrid switched multi-pulse/stochastic speech coding technique
US4975956A (en) * 1989-07-26 1990-12-04 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
GB2235354A (en) * 1989-08-16 1991-02-27 Philips Electronic Associated Speech coding/encoding using celp
US5091945A (en) * 1989-09-28 1992-02-25 At&T Bell Laboratories Source dependent channel coding with error protection
AU6174290A (en) * 1989-10-06 1991-04-28 Motorola, Inc. Error detection/correction scheme for vocoders
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
JPH03181232A (ja) * 1989-12-11 1991-08-07 Toshiba Corp 可変レート符号化方式
US5097507A (en) * 1989-12-22 1992-03-17 General Electric Company Fading bit error protection for digital cellular multi-pulse speech coder
CH680030A5 (ja) * 1990-03-22 1992-05-29 Ascom Zelcom Ag
JP3102015B2 (ja) * 1990-05-28 2000-10-23 日本電気株式会社 音声復号化方法
US5103459B1 (en) * 1990-06-25 1999-07-06 Qualcomm Inc System and method for generating signal waveforms in a cdma cellular telephone system
US5235671A (en) * 1990-10-15 1993-08-10 Gte Laboratories Incorporated Dynamic bit allocation subband excited transform coding method and apparatus
US5187745A (en) * 1991-06-27 1993-02-16 Motorola, Inc. Efficient codebook search for CELP vocoders
BR9206143A (pt) * 1991-06-11 1995-01-03 Qualcomm Inc Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5566206A (en) * 1993-06-18 1996-10-15 Qualcomm Incorporated Method and apparatus for determining data rate of transmitted variable rate data in a communications receiver
US5537410A (en) * 1994-09-15 1996-07-16 Oki Telecom Subsequent frame variable data rate indication method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019505840A (ja) * 2016-01-03 2019-02-28 アウロ テクノロジーズ エンフェー. 予測器モデルを使用する信号符号器、復号器及び方法
JP7082056B2 (ja) 2016-01-03 2022-06-07 アウロ テクノロジーズ エンフェー. 予測器モデルを使用する信号符号器、復号器及び方法

Also Published As

Publication number Publication date
CA2635914A1 (en) 1992-12-23
ATE294441T1 (de) 2005-05-15
NO319559B1 (no) 2005-08-29
IL102146A (en) 1996-03-31
CA2483324A1 (en) 1992-12-23
EP1162601A2 (en) 2001-12-12
DE69232202T2 (de) 2002-07-25
MX9202808A (es) 1992-12-01
CN1492395A (zh) 2004-04-28
DK0588932T3 (da) 2002-03-11
US5657420A (en) 1997-08-12
ATE272883T1 (de) 2004-08-15
IL113988A (en) 1996-11-14
FI20061121A (fi) 2006-12-15
EP1107231A2 (en) 2001-06-13
NO934544D0 (no) 1993-12-10
JP3432822B2 (ja) 2003-08-04
CN1286086C (zh) 2006-11-22
CN1220334C (zh) 2005-09-21
CN1196271C (zh) 2005-04-06
US5778338A (en) 1998-07-07
IL113986A (en) 1996-11-14
EP0588932A1 (en) 1994-03-30
AU2186592A (en) 1993-01-12
HK1014796A1 (en) 1999-09-30
ATE477571T1 (de) 2010-08-15
JP3566669B2 (ja) 2004-09-15
CN1119796C (zh) 2003-08-27
JP2006221186A (ja) 2006-08-24
EP1998319A3 (en) 2008-12-17
CA2483296C (en) 2008-01-22
ES2240252T3 (es) 2005-10-16
CA2102099A1 (en) 1992-12-12
FI20061122L (fi) 2006-12-15
ES2225321T3 (es) 2005-03-16
CN1159639A (zh) 1997-09-17
EP1998319B1 (en) 2010-08-11
JP2002202800A (ja) 2002-07-19
EP1107231B1 (en) 2005-04-27
EP1763020A3 (en) 2010-09-29
CN1909059A (zh) 2007-02-07
EP1107231A3 (en) 2001-12-05
EP1126437A2 (en) 2001-08-22
DE69233397T2 (de) 2005-08-11
CN1167309A (zh) 1997-12-10
DE69233794D1 (de) 2010-09-23
FI20011509A (fi) 2001-07-10
WO1992022891A1 (en) 1992-12-23
IL113986A0 (en) 1995-10-31
JP2005182075A (ja) 2005-07-07
BR9206143A (pt) 1995-01-03
EP1239456A1 (en) 2002-09-11
EP1126437A3 (en) 2001-12-12
EP1126437B1 (en) 2004-08-04
DE69233502D1 (de) 2005-06-02
CN1381956A (zh) 2002-11-27
IL113988A0 (en) 1995-10-31
CA2483324C (en) 2008-05-06
DK1126437T3 (da) 2004-11-08
JP3955600B2 (ja) 2007-08-08
DE69232202D1 (de) 2001-12-20
HK1064785A1 (en) 2005-02-04
DE69233397D1 (de) 2004-09-09
EP1162601A3 (en) 2002-07-03
AU6089396A (en) 1996-10-03
SG70558A1 (en) 2000-02-22
AU1482597A (en) 1997-05-15
ES2348319T3 (es) 2010-12-02
AU693374B2 (en) 1998-06-25
FI935597A (fi) 1993-12-13
CA2568984C (en) 2007-07-10
CA2483296A1 (en) 1992-12-23
HUT70719A (en) 1995-10-30
HK1127152A1 (en) 2009-09-18
CA2483322A1 (en) 1992-12-23
AU671952B2 (en) 1996-09-19
ZA924082B (en) 1993-02-26
IL113987A0 (en) 1995-10-31
DE69233502T2 (de) 2006-02-23
FI118702B (fi) 2008-02-15
CN1071036A (zh) 1993-04-14
ES2166355T3 (es) 2002-04-16
CN1398052A (zh) 2003-02-19
CN1091535C (zh) 2002-09-25
JP4191746B2 (ja) 2008-12-03
CN1112673C (zh) 2003-06-25
JPH06511320A (ja) 1994-12-15
US5414796A (en) 1995-05-09
NO934544L (no) 1993-12-10
IL113987A (en) 1996-11-14
EP1998319A2 (en) 2008-12-03
EP0588932B1 (en) 2001-11-14
JP2006079107A (ja) 2006-03-23
JP3751957B2 (ja) 2006-03-08
RU2107951C1 (ru) 1998-03-27
EP1675100A2 (en) 2006-06-28
AU711484B2 (en) 1999-10-14
CA2102099C (en) 2006-04-04
FI935597A0 (fi) 1993-12-13
FI120425B (fi) 2009-10-15
FI20011508A (fi) 2001-07-10
JP3964915B2 (ja) 2007-08-22
ATE208945T1 (de) 2001-11-15
CA2568984A1 (en) 1992-12-23
CA2483322C (en) 2008-09-23
EP1763020A2 (en) 2007-03-14
JP2002023796A (ja) 2002-01-25
HU215861B (hu) 1999-03-29

Similar Documents

Publication Publication Date Title
JP3566669B2 (ja) フレームエラーをマスクする方法および装置
AU685902B2 (en) Linear prediction coefficient generation during frame erasure or packet loss
KR100488080B1 (ko) 멀티모드 음성 인코더
JP2007525723A (ja) 音声通信のためのコンフォートノイズ生成の方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20031202

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20040225

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20040304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040803

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20041027

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20041102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050921

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050927

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051208

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091216

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091216

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101216

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111216

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121216

Year of fee payment: 7

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121216

Year of fee payment: 7