JP5027966B2 - 入力信号をボコーディングする方法および装置およびそのためのコンピュータ読み出し可能信号を有する媒体を含む製造物品 - Google Patents

入力信号をボコーディングする方法および装置およびそのためのコンピュータ読み出し可能信号を有する媒体を含む製造物品 Download PDF

Info

Publication number
JP5027966B2
JP5027966B2 JP2001239069A JP2001239069A JP5027966B2 JP 5027966 B2 JP5027966 B2 JP 5027966B2 JP 2001239069 A JP2001239069 A JP 2001239069A JP 2001239069 A JP2001239069 A JP 2001239069A JP 5027966 B2 JP5027966 B2 JP 5027966B2
Authority
JP
Japan
Prior art keywords
signal
pulse
track
pulse position
computer readable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001239069A
Other languages
English (en)
Other versions
JP2002108400A (ja
Inventor
エイ.ベンノ スティーブン
Original Assignee
アルカテル−ルーセント ユーエスエー インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アルカテル−ルーセント ユーエスエー インコーポレーテッド filed Critical アルカテル−ルーセント ユーエスエー インコーポレーテッド
Publication of JP2002108400A publication Critical patent/JP2002108400A/ja
Application granted granted Critical
Publication of JP5027966B2 publication Critical patent/JP5027966B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声圧縮に係り、特に、CELP(code excited linear prediction)ボコーディングに関する。
【0002】
【従来の技術】
音声エンコーダ/デコーダ(ボコーダ)は、通信チャネルにおいて必要とされる伝送帯域幅を減少させるために、スピーチ信号を圧縮する。通話あたりに必要とされる伝送帯域幅を低減することにより、同じ通信チャネルを介する通話の数を増大させることが可能である。LPC(linear predictive coding)技法のような初期のスピーチコーディング技法は、信号の冗長性を除去するためにフィルタを使用し、スピーチ信号を圧縮する。LPCフィルタは、人間の音声をモデル化することを試みるスペクトル包絡線を再生する。また、LPCフィルタは、無音声音についての雑音のような入力を受信する一方で、鼻音および母音に対する準周期的入力を受信することにより励起される。
【0003】
CELP(code excited linear prediction)ボコーダとして知られるクラスのボコーダが存在する。CELPボコーディングは、主として、4−8kbpsにおいて、他の32kbpsスピーチコーディング技法に匹敵するスピーチ品質を達成しうるスピーチデータ圧縮技法である。CELPボコーダは、以前のLPC技法に対して2つの改善を有する。第1に、CELPボコーダは、ピッチプレディクタ(pitch predictor)を使用してピッチ情報を抽出することにより、より音声の詳細を捉えることを試みる。第2に、CELPボコーダは、実際のスピーチ波形から作られた残留信号から得られた雑音のような信号でLPCフィルタを励起する。
【0004】
CELPボコーダは、3つのメインコンポーネント、1)短時間予測フィルタ(short term predictive filter)、2)ピッチプレディクターまたは適応形コードブックとしても知られている長時間予測フィルタ(long term predictive filter)、および3)固定コードブックを含む。圧縮は、元のスピーチ信号を表すために使用されるビット数よりも少ない所定数のビットを各コンポーネントに割り当てることによりなされる。第1のコンポーネントは、スピーチ信号中の短時間冗長性を除去するために、線形予測を使用する。短時間プレディクターから生じる誤差、または残留信号は、長時間プレディクターに対するターゲット信号となる。
【0005】
発声されたスピーチは、準周期的性質を有し、長時間プレディクタは、残差からピッチピリオドを抽出し、以前のピリオドから予測されうる情報を除去する。長時間および短時間予測フィルタの後、得られる残留信号は、ほとんど雑音のような信号である。アナリシス・バイ・シンセサイズ(analysis-by-synthesis )を使用して、固定コードサーチは、そのベクトルのライブラリーからのエントリーと雑音のような残差を置き換えるために、最適な一致を見出す。最適一致ベクトルを表すコードが、雑音の多い残差の代わりに送信される。代数的CELP(ACELP)ボコーダにおいて、固定コードブックは、数個の非ゼロパルスからなり、パルスのロケーションおよび符号(例えば、+1または−1)により表現される。
【0006】
典型的な構成において、CELPボコーダは、到来スピーチ信号を複数のフレームにブロック化、即ち分割し、短時間プレディクタのLPC係数をフレーム毎に一度更新する。LPC残差は、長時間プレディクタおよび固定コードブックサーチのためにサブフレームに分割される。例えば、入力スピーチは、短時間プレディクタのために、160サンプルフレームにブロック化され得る。そして、得られるフレームは、53個のサンプル、53個のサンプル、および54個のサンプルのサブフレームに分解され得る。各サブフレームは、長時間プレディクタおよび固定コードブックサーチにより処理される。
【0007】
図1において、スピーチ信号100のシングルフレームの一例が示されている。スピーチ信号100は、異なるピッチの発声信号および非発声信号からなる。発声信号100は、LPCフィルタを有するCELPボコーダにより受信される。CELPボコーダの第1のステップは、スピーチ信号中の短時間冗長性を除去することである。短時間冗長性を除去した得られる信号は、図2の残留スピーチ信号200である。
【0008】
LPCフィルタは、全ての冗長性情報を除去することができず、フィルタされたスピーチ信号200中の残った準周期的ピークおよび谷は、ピッチパルスと呼ばれる。そして、短時間予測フィルタが、スピーチ信号200に適用されて、図3の短時間フィルタされた信号300となる。長時間予測フィルタは、図3の残留スピーチ信号300から準周期的ピッチパルスを除去して、図4の雑音に近い信号400とし、これは、固定コードブックサーチのためのターゲット信号となる。図4は、3個のサブフレーム354,356,358に分割された固定コードブックターゲット信号350の160サンプルフレームのプロットである。そして、コード値は、通信ネットワークを送信される。
【0009】
図5において、サブフレーム中にパルスの位置をマップするルックアップテーブル470が示されている。サブフレーム内のパルスは、ルックアップテーブル内で、16個の可能性のある位置402のうちの1つにあるように制約される。各トラック404は16個の可能のある位置402を有するので、各パルスロケーションを同定するために、4ビットのみが必要とされる。各パルスマッピングは、個々のトラック404において生じる。したがって、2つのトラック406,408が、サブフレームからの2つの信号パルスのパルス位置のマッピングを可能にする。
【0010】
この例において、図4のサブフレーム354は、励起において53個のサンプルのみを有し、位置0−52のみを有効位置とする。図5のトラック406,408が分割されるので、元の励起の長さを超える位置が、各トラック中に存在する。トラック1中の位置56および60、およびトラック2中の位置57および61は、無効であり、不使用である。図4の最初の2個のパルス310,312のロケーションは、サンプル13およびサンプル17に対応する。
【0011】
図5のテーブル400を使用することにより、サンプル13が、最初のトラック406中の位置3 410にあることが決定される。第2のパルスは、サンプル17中にあり、位置4 412において第2のトラック408中にある。したがって、パルスは、それぞれ4ビットとして表現されかつ送信され得る。コードブックは、2個のトラックのみを有するので、図4の他のパルス314、サブフレーム354中の316,318,320および322は無視される。
【0012】
パルス位置は、トラック中の絶対的パルス位置により制約される。不都合なことに、CELPボコーダは、パルスをトラック中の隣接位置に置く傾向にある。パルスをトラック中の隣接位置に置くことにより、発音のよりバランスしたエンコーディングではなくスピーチ音の開始がエンコードされる。また、ボコーダに対するビットレートが減少し、かつより少ないパルスが使用されるので、音声品質は、パルスのトラック中への非効率的な配置により悪影響を受ける。
【0013】
【発明が解決しようとする課題】
パルスが隣接トラック位置に配置される可能性を低減する方法が必要とされている。
【0014】
【課題を解決するための手段】
第1のトラック中の信号パルスの位置に対して、第2のトラック中の信号パルスの配置を実行することにより、絶対的トラック位置配置の非効率さが除去される。信号パルスのエンコーディングの間に、N+1個のトラック中のN+1個の信号パルスの相対配置を実行することで、デコードされた信号の信号品質が増大する。増大した信号品質は、トラック中にパルスをより正確に配置することにより、かつトラック内の信号パルス位置の隣接配置の発生を低減することにより、達成される。
【0015】
【発明の実施の形態】
図6において、相対的にパルス位置が制約された2トラックコードブックテーブルが示されている。テーブル500は、各トラックに対して16個の可能性のある信号パルス位置506を同定する2個のパルス位置トラック502,504(共通的に“トラック”と呼ぶ)を含む。トラック1 502およびトラック2504中の固定コードブックエントリーゼロないし13 508が、可能性のある有効パルス位置である。
【0016】
コードブック中のパルステーブル位置14 510および15 512は、両方のトラックにおいて不使用である。また、第1のトラック中の可能性ある第1のパルス位置は、4により分割可能なパルス位置(即ち、0,4,8,…,52)にあるように制約される。第2のトラック中の第2のパルス位置は、第1のトラック中の第1の信号パルスのインデックス位置506に関連している。
【0017】
隣接トラック位置における信号パルスをエンコードするのではなく、第2の信号パルスの相対的ポジショニングが起きる。トラック中でエンコードされる隣接信号パルスをより少なくすることにより、信号パルスが、ボコーダによりデコードされる信号の音声品質を改善するバーストエネルギの再生をよりよく可能にする。単一信号パルスが、この実施形態において、2個のトラック502および504の各々においてエンコードされる。第1のトラック中の第1の信号パルスに関連して第2のトラック中の第2の信号パルスを配置することにより、デコードされた発声の品質が増大する。代替的な実施形態において、コードブックテーブルは、2個より多いトラックを含み、トラック中の追加的信号パルスが、以前の信号パルスの以前のトラック位置に関連する。
【0018】
この実施形態において、第2のトラック中の第2の信号パルスの相対的ロケーションは、第1のトラック中の第1の信号パルスに関連する。代替的な実施形態において、第2のトラック中の第2の信号パルスの相対位置は、第1のシングルパルスサンプル位置に関連する。さらに別の実施形態において、第2のトラック中の信号パルス位置は、逐次的でない順序(即ち、1,−1,7,−7,2,−2,6,−6,3,−3,5,−5,4,−4)でグループ化され得る。
【0019】
図7において、送信機デバイス602および受信機デバイス604を有する通信システム605が示されている。送信機および受信機通信デバイス602,604が、通信パス606により一緒に結合されている。通信パス606は、選択的に、ローカルエリアネットワーク、ワイドエリアネットワーク、インターネット、ATMネットワーク、または公衆電話網のようなワイヤベースドネットワーク、またはセルラ、マイクロウェーブまたはサテライトネットワークのようなワイヤレスネットワークであり得る。通信パス606の主要な要求条件は、送信機602と受信機604との間でデジタルデータを転送する能力である。
【0020】
各デバイス602,604は、対応する信号入力/出力ユニット608,610を有する。ユニット608,610は、送信機デバイス602および受信機デバイス604へ/からアナログ音声信号を転送する電話デバイスとして示されている。信号入力/出力ユニット608は、2ワイヤ通信パス612により送信機デバイス602に結合されている。同様に、他の信号入力/出力ユニット610は、別の2ワイヤ通信パス614を介して受信機デバイス604に結合されている。代替的な実施形態において、信号入力ユニットは、送信および受信通信デバイスに内蔵されている(即ち、送信および受信デバイスに組み込まれたスピーカおよびマイクロホン)か、またはワイヤレス通信パスを介して通信する(即ち、コードレス電話機)。
【0021】
送信機デバイス602は、2ワイヤ通信パス612に結合されたアナログ信号ポート616、CELPボコーダ618、およびコントローラ620を含む。コントローラ620は、アナログ信号ポート616、ボコーダ618、およびネットワークインターフェース622に結合されている。また、ネットワークインターフェース622は、ボコーダ618、コントローラ620、通信パス606に結合されている。
【0022】
同様に、受信機デバイス604は、別のコントローラ626に結合された別のネットワークインターフェース624、通信パス604、および別のボコーダ628を有する。他のコントローラ626が、他のボコーダ628、他のネットワークインターフェース624、別のアナログ信号ポート630に結合されている。また、他のアナログ信号ポート630が、他の2ワイヤ通信パス614に結合されている。
【0023】
音声信号は、アナログポート616において、信号入力デバイス608から受信される。コントローラ620は、送信機デバイス602のための制御およびタイミング信号を提供し、アナログポート161が受信された信号をボコーダ618へ信号圧縮のために転送することを可能にする。ボコーダ618は、受信された信号を圧縮するために、図6に示されたデータ構造を備えた固定コードブックを有する。図6のデータ構造500は、フィルタされた信号からの第1の信号パルスを、第1のトラック内のパルス位置に関連づける。また、第2の信号パルスは、第2のパルス位置に関連づけられ、第1のトラック中の第1の信号パルスの第1のパルス位置に関連して決定される。
【0024】
第2のパルス位置を第1のパルス位置に関連して割り当てることにより、トラック中で2つの信号パルスは隣接して割当てられることが防止される。第1の信号パルスは、エンコードされて、第1のトラック502中のパルス位置に割り当てられ、第2のトラック504中の第2の信号パルスのパルス位置が、第1のトラック502に関連してエンコードされる。第2のパルス位置の相関的エンコーディングは、圧縮された信号が、第1のパルス位置が第2のパルス位置に隣接しないというより高い可能性を有する結果となる。そして、圧縮された信号は、図7のボコーダ618から、ネットワークインターフェース622へ送られる。ネットワークインターフェース622は、圧縮された信号を、通信パス606を介して受信機デバイス604へ送信する。
【0025】
受信機デバイス604中に配置された他のネットワークインターフェース624は、圧縮信号を受信する。受信機コントローラ626は、受信された圧縮信号が受信機ボコーダ628に転送されることを可能にする。受信機ボコーダ628は、図6のルックアップテーブル500を使用することにより、圧縮信号をデコードする。図7のボコーダ628は、図6のルックアップテーブル500を使用して、受信された圧縮信号からアナログ信号を再生成する。ルックアップテーブルは、固定コードブックコントレビューションを再生成し、そして、長時間および短時間プレディクターによりフィルタされる。アナログ信号は、図7の受信機アナログ信号ポート630を介して、受信機信号入力/出力デバイス610へ送られる。
【0026】
図8において、送信機602によりアナログスピーチ信号の信号処理が示されている。プリプロセッサ710は、アナログ信号を受信するための入力を有し、LPフィルタ714および信号コンバイナ712に結合されている。信号コンバイナ712は、プリプロセッサ710および合成フィルタ716からの信号を結合する。信号コンバイナ712の出力は、知覚的重み付けプロセッサ718に結合されている。合成フィルタ716は、LP分析フィルタ714、信号コンバイナ712、別の信号コンバイナ720、適応形コードブック732、およびピッチアナライザ722に結合されている。
【0027】
ピッチアナライザ722は、知覚的重み付けプロセッサ718、固定コードブックサーチ734、適応形コードブック732、合成フィルタ716、他の信号コンバイナ720、およびパラメータエンコーダ724に結合されている。パラメータエンコーダ724は、送信機728、固定コードブックサーチ734、固定コードブック730、LPフィルタ714、およびピッチアナライザ722に結合されている。
【0028】
アナログ信号が、図7のアナログデバイス608からプリプロセッサ710において受信される。図8のプリプロセッサ710は、信号を処理し、利得および他の信号特性を調節する。そして、プリプロセッサ710からの信号は、LP分析フィルタ714および信号コンバイナ712の両方に経路選択される。LP分析フィルタ714により生成される係数情報は、合成フィルタ716、知覚的重み付けプロセッサ718、およびパラメータエンコーダ724に送られる。合成フィルタ716は、LPフィルタ714からのLP係数情報および他の信号コンバイナ720からの信号を受信する。
【0029】
スピーチの粗い短時間スペクトル形状をモデル化する合成フィルタ716は、信号コンバイナ712によりプリプロセッサ710の出力と結合される信号を生成する。信号コンバイナ712から得られる信号は、知覚的重み付けプロセッサ718によりフィルタされる。知覚的重み付けプロセッサ718は、LPフィルタ714からのLP係数情報も受信する。知覚的重み付けプロセッサ718は、コーディング歪みが、高いスピーチエネルギを含む周波数において信号スペクトルを増幅し、より低いスピーチエネルギを含む周波数を減衰させることにより有効に「マスクされる」ポストフィルタである。
【0030】
知覚的重み付けプロセッサ718の出力は、固定コードブックサーチ734およびピッチアナライザ722に送られる。固定コードブックサーチ734は、パラメータエンコーダ724および固定コードブック730に送られるコード値を生成する。固定コードブックサーチ734は、固定コードブック734と分離して示されているが、代替的に、固定コードブック730に含めることができ、別個に構成される必要はない。また、固定コードブックサーチは、図6のルックアップテーブル500のデータ構造へのアクセスを有し、第1のパルス位置に関連する第2のパルス位置の決定は、エンコードされるべきより正確なパルス信号情報を可能にし、コードブックエンコーディング隣接パルスの発生を減少させる。
【0031】
図8のピッチアナライザ722は、パラメータエンコーダ724および適応形コードブック732へ送られるピッチデータを生成する。適応形コードブック732は、ピッチアナライザ722からのピッチデータおよび信号コンバイナ720からのフィードバック信号を受信し、スピーチ信号の長時間(即ち、周期的)成分をモデル化する。適応形コードブック信号の出力は、信号コンバイナ720により、固定コードブック730の出力と結合される。
【0032】
固定コードブック730は、固定コードブックサーチ734により生成されたコード値を受信し、信号を再生成する。生成された信号は、信号コンバイナ720により適応形コードブック732からの信号と結合される。得られる結合信号は、スピーチ信号の短時間スペクトル形状をモデル化するために、合成フィルタ716により使用され、適応形コードブック732へフィードバックされる。
【0033】
パラメータエンコーダは、固定コードブックサーチ734、ピッチアナライザ722、およびLPフィルタ714からのパラメータを受信する。受信されたパラメータを使用するパラメータエンコーダは、圧縮信号を生成する。そして、圧縮信号は、ネットワークを介して送信機728により送信される。
【0034】
上記システムの代替的な実施形態において、ボコーダのエンコーダおよびデコーダ部は、デジタルアンサリングマシンのような同じデバイス中に存在する。そのような実施形態における通信パスは、圧縮信号がメモリに記憶されかつこれから検索されることを可能にするデータバスである。
【0035】
図9において、本発明の一実施形態によるCELPボコーダを有する受信機デバイスの図が示されている。受信機デバイス604は、受信機802に結合されたネットワークインターフェース661を有する。固定コードブック804は、受信機802およびゲインファクタ“c”812に結合されている。信号コンバイナ806は、合成フィルタ808、ゲインファクタ“p”811およびゲインファクタ“c”812に結合されている。適応形コードブック810は、ゲインファクタ“p”811および信号コンバイナ806の出力に結合されている。合成フィルタ808は、信号コンバイナ806および知覚的ポストフィルタ814の出力に接続されている。知覚的ポストフィルタは、他のアナログポート630および合成フィルタ808に結合されている。
【0036】
圧縮信号は、ネットワークインタフェース616において、受信機デバイス604により受信される。受信機802は、ネットワークインターフェース616において受信された圧縮信号からデータをアンパック(unpack)する。データは、固定コードブックインデックス、固定コードブックゲイン、適応形コードブックインデックス、適応形コードブックゲインおよびLP係数に対するインデックスからなる。固定コードブック804は、図6のルックアップテーブル500のデータ構造を含む。
【0037】
図9の固定コードブック804は、信号コンバイナ806により、適応形コードブック810およびゲインファクタ812からの信号と結合される信号を生成する。そして、信号コンバイナ806からの結合信号は、合成フィルタ808において受信され、適応形コードブック810にフィードバックされる。合成フィルタ808は、スピーチ信号を再生成するために結合信号を使用する。再生成されたスピーチ信号は、スピーチ信号を調節する知覚的ポストフィルタ814を通過させられる。そして、スピーチ信号は、アナログポート630により、同様のコードブックを有する受信機へ送られる。
【0038】
図10において、以前のパルス位置に関するN+1トラック中のパルス位置を有するルックアップテーブルまたはコードブックを使用するボコーディングの方法のフローチャートが示されている。ステップ902において、入力信号(例えば、アナログ音声信号)が、図7の受信機デバイス604において受信される。入力信号は、図10のステップ903において信号フレームに分割され、個別の信号部分が処理され得る。各信号フレームは、図10のステップ904において、図8のフィルタ714により処理され、残留信号と呼ばれるフィルタされた入力信号となる。
【0039】
フィルタされた残留信号は、図10のステップ906において、長時間フィルタによりさらにフィルタされ、図8の適応形コードブック732は、信号パルスを有するフィルタされた入力信号から長時間信号冗長性を変換または除去する。図10のステップ908において、固定コードブックインデックスは、第1のトラック内の第1の信号パルスのロケーションを同定する。図8の固定コードブック730は、図6のルックアップテーブル500および第1のトラック中の第1のパルス位置への第2のトラック中の第2のパルス位置の相対マッピングを含む。ステップ909において、第2のパルス位置のオフセットは、第1のパルス位置に関して決定され、第2のパルスの配置をより正確にする。
【0040】
ルックアップテーブル500は、信号から残りのパルス信号を表すバイナリパターンを生成するために、図8の固定コードブック730により使用される。バイナリパターンは、図10のステップ910において、パルス位置のインデックスを含む信号にエンコードされる。そして、エンコードされた信号は、ステップ912において、通信パスを介して送信される。
【0041】
現在の技術水準は、ソフトウェアにより構成されたCELPボコーダを作るために、汎用デジタルシグナルプロセッサを他の電子的要素と組み合わせることを可能にする。したがって、コンピュータで読み出し可能な信号を有する媒体は、コードブック中のパルス位置を制限するための更なる制約を有するボコーダを具現化するためのソフトウェアコードを含み得る。
【0042】
【発明の効果】
以上説明したように、本発明によれば、パルスが隣接トラック位置に配置される可能性を低減する方法を提供することができる。
【図面の簡単な説明】
【図1】スピーチ信号の信号フレームを示す図。
【図2】短時間周期フィルタされた単一スピーチフレームを示す図。
【図3】適応形コードブックフィルタされた単一スピーチフレームを示す図。
【図4】3個のサブフレームに分割された160サンプルスピーチフレームを構成する既知の方法を示す図。
【図5】16個の可能性のあるパルス位置のうちの1つに制約される信号パルスを有する既知のCELPボコーダコードブックルックアップテーブルを示す図。
【図6】本発明の一実施形態による相対的制約パルス位置を有するCELPボコーダコードブックを示す図。
【図7】本発明の一実施形態によるCELPボコーディングを使用する送信デバイスおよび受信デバイスを備えた通信システムを示す図。
【図8】本発明の一実施形態による音声信号をエンコードするCELPボコーダを有する送信デバイスを示す図。
【図9】本発明の一実施形態によるCELPボコーダを有する受信デバイスを示す図。
【図10】本発明の一実施形態による音声信号をボコーディングする方法を示すフローチャート。
【符号の説明】
100 スピーチ信号
200 残留スピーチ信号
300 短時間フィルタされた信号
310,312,314,316,318,320,322 パルス
350 固定コードブックターゲット信号
354,356,358 サブフレーム
400 雑音に近い信号
404,406,408 トラック
470 ルックアップテーブル
500 データ構造
600 通信システム
602 送信機デバイス
604 受信機デバイス
606,612,614 通信パス
608 信号入力ユニット
610 信号出力ユニット
616,630 アナログ信号ポート
618 CELPボコーダ
620,626 コントローラ
622,624 ネットワークインターフェース
628 ボコーダ
710 プロセッサ
712 信号コンバイナ
714 LPフィルタ
716 合成フィルタ
718, 808 知覚的重み付けプロセッサ
720,806 信号コンバイナ
722 ピッチアナライザ
724 パラメータエンコーダ
728 送信機
731 ゲインファクタ“C”
733 ゲインファクタ“P”
732,810 適応形コードブック
734 固定コードブックサーチ
802 受信機
804 固定コードブック
814 知覚的ポストフィルタ

Claims (18)

  1. 入力信号をボコーディングする方法であって、
    前記入力信号をフィルタリングして、第1の信号パルスおよび第2の信号パルスを有する信号を得るための、フィルタリングするステップと、
    前記第1の信号パルスを、ルックアップテーブルの第1のトラック内の第1のパルス位置からアクセスされた励起パラメータと関連づけることにより、前記第1の信号パルスをエンコードするステップとを含み、前記第1のパルス位置は前記第1のトラック内のパルス位置の所定のセットのうちの1つであり、前記方法がさらに、
    前記ルックアップテーブルの第2のトラック内の第1のパルス位置の関数として、第2の信号パルスを、第2のパルス位置からアクセスされた励起パラメータに割当てるステップを含み、前記第2のトラック内の前記第2のパルス位置は前記第1のトラック内の前記第1のパルス位置とは非隣接関係にある、方法。
  2. 前記フィルタリングするステップが、前記信号を線形予測フィルタで処理するステップをさらに含む、請求項1に記載の方法。
  3. 前記信号を複数の信号フレームに分割するステップをさらに含む、請求項1に記載の方法。
  4. 前記分割するステップが、アナログ信号を受信するステップとさらに含む、請求項3に記載の方法。
  5. 前記分割するステップが、デジタル信号を受信するステップをさらに含む、請求項3に記載の方法。
  6. 前記割当てるステップが、前記第1の信号パルスから前記第2の信号パルスのオフセットを同定するステップをさらに含む、請求項1に記載の方法。
  7. 前記同定するステップが、前記第2の信号パルス位置から前記第1の信号パルス位置のオフセットを計算するステップをさらに含む、請求項6に記載の方法。
  8. 入力信号をボコーディングする装置であって、
    入力信号の受信に応答して、少なくとも第1の信号パルスおよび第2の信号パルスを有する信号を生成する線形予測フィルタと、
    複数のトラック位置を有するルックアップテーブルを有するプロセッサとを備え、前記第1の信号パルスが第1の複数のトラック位置の第1のトラック位置に割り当てられ、第1のパルス位置は前記第1のトラック内のパルス位置の所定のセットのうちの1つであり、複数の励起パラメータになる前記第1の信号パルスの第1のトラック位置の関数として、前記第2の信号パルスが、第2の複数のパルス位置の第2のトラック位置に割り当てられ、そして、前記第2のトラック内の前記第2のパルス位置は前記第1のトラック内の前記第1のパルス位置とは非隣接関係にあり、前記装置はさらに、
    前記プロセッサからの前記複数の励起パラメータの受信に応答して、送信信号において前記複数の励起パラメータを送信する送信機を備える、装置。
  9. 入力ポートの入力ポート受信に応答して、入力信号を入力信号フレームに分割するためのメモリバッファを有する入力ポートをさらに含む、請求項8に記載の装置。
  10. 前記プロセッサは、前記信号中の前記第1の信号パルスから前記第2の信号パルスのオフセットを決定する、請求項8に記載の装置。
  11. 前記プロセッサは、前記第1のトラック位置から前記第2の信号パルスのオフセットを決定する、請求項8に記載の装置。
  12. 前記入力信号がアナログ信号である、請求項8に記載の装置。
  13. 前記入力信号がデジタル信号である、請求項8に記載の装置。
  14. 信号をボコーディングする方法を実行するためのコンピュータ読取可能プログラムコードを有するコンピュータ読取可能信号担持媒体であって、
    前記コンピュータ読取可能信号担持媒体の有する前記コンピュータ読取可能プログラムコードは、
    入力信号の受信に応答して、少なくとも第1の信号パルスおよび第2の信号パルスを有する信号を生成する線形予測フィルタによって、該入力信号をフィルタリングして、第1の信号パルスと第2の信号パルスとを有する信号を得るステップと、
    複数のトラック位置を有するルックアップテーブルを有するプロセッサによって、前記第1の信号パルスをルックアップテーブルの第1のトラック内の第1のパルス位置に関連づけることにより、前記第1の信号パルスをエンコードするステップと、さらに、
    前記プロセッサによって、前記ルックアップテーブルの第2のトラック内の第1のパルス位置の関数として、前記第2の信号パルスを第2のパルス位置に割り当てるステップと、を有し、
    前記第1のパルス位置は前記第1のトラック内のパルス位置の所定のセットのうちの1つであり、
    前記第2のトラック内の前記第2のパルス位置は前記第1のトラック内の前記第1のパルス位置とは非隣接関係にある、コンピュータ読取可能信号担持媒体
  15. 前記コンピュータ読取可能プログラムコードは、前記プロセッサによって、前記第1の信号パルスから前記第2の信号パルスのオフセットを同定するための第のコンピュータ読取可能プログラムコードを有する、請求項14記載のコンピュータ読取可能信号担持媒体
  16. 前記第のコンピュータ読取可能プログラムコードは、前記プロセッサによって、第2のパルス位置から前記第1のパルス位置のオフセットを計算するためのコンピュータ読取可能プログラムコードをさらに有する、請求項15記載のコンピュータ読取可能信号担持媒体
  17. 前記第1のトラックの前記第1のパルス位置は、4により分割可能な前記第1のトラックのパルス位置にあるように制約される、請求項1に記載の方法。
  18. 前記第1のトラックの前記第1のパルス位置は、4により分割可能な前記第1のトラックのパルス位置にあるように制約される、請求項8に記載の装置。
JP2001239069A 2000-08-07 2001-08-07 入力信号をボコーディングする方法および装置およびそのためのコンピュータ読み出し可能信号を有する媒体を含む製造物品 Expired - Fee Related JP5027966B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/633,465 US6728669B1 (en) 2000-08-07 2000-08-07 Relative pulse position in celp vocoding
US09/633465 2000-08-07

Publications (2)

Publication Number Publication Date
JP2002108400A JP2002108400A (ja) 2002-04-10
JP5027966B2 true JP5027966B2 (ja) 2012-09-19

Family

ID=24539732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001239069A Expired - Fee Related JP5027966B2 (ja) 2000-08-07 2001-08-07 入力信号をボコーディングする方法および装置およびそのためのコンピュータ読み出し可能信号を有する媒体を含む製造物品

Country Status (9)

Country Link
US (1) US6728669B1 (ja)
EP (1) EP1184842B1 (ja)
JP (1) JP5027966B2 (ja)
KR (1) KR20020012509A (ja)
CN (1) CN1200404C (ja)
BR (1) BR0106825A (ja)
CA (1) CA2350353A1 (ja)
DE (1) DE60101827T2 (ja)
TW (1) TW521265B (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6980948B2 (en) * 2000-09-15 2005-12-27 Mindspeed Technologies, Inc. System of dynamic pulse position tracks for pulse-like excitation in speech coding
US6847929B2 (en) * 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
KR100503414B1 (ko) * 2002-11-14 2005-07-22 한국전자통신연구원 고정 코드북의 집중 검색 방법 및 장치
US20040208169A1 (en) * 2003-04-18 2004-10-21 Reznik Yuriy A. Digital audio signal compression method and apparatus
US7742926B2 (en) 2003-04-18 2010-06-22 Realnetworks, Inc. Digital audio signal compression method and apparatus
ES2291939T3 (es) * 2003-09-29 2008-03-01 Koninklijke Philips Electronics N.V. Codificacion de señales de audio.
US8502706B2 (en) * 2003-12-18 2013-08-06 Intel Corporation Bit allocation for encoding track information
KR100723400B1 (ko) 2004-05-12 2007-05-30 삼성전자주식회사 복수의 룩업테이블을 이용한 디지털 신호 부호화 방법 및장치
SG123639A1 (en) * 2004-12-31 2006-07-26 St Microelectronics Asia A system and method for supporting dual speech codecs
US7224295B2 (en) * 2005-07-11 2007-05-29 Mediatek Inc. System and method for modulation and demodulation using code subset conversion
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
CN101286321B (zh) * 2006-12-26 2013-01-09 华为技术有限公司 双脉冲激励的线性测编码
CN102623012B (zh) 2011-01-26 2014-08-20 华为技术有限公司 矢量联合编解码方法及编解码器
JP5981909B2 (ja) * 2011-06-15 2016-08-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America パルス位置探索装置、符号帳探索装置、及びこれらの方法
WO2013002696A1 (en) 2011-06-30 2013-01-03 Telefonaktiebolaget Lm Ericsson (Publ) Transform audio codec and methods for encoding and decoding a time segment of an audio signal
CN103946918B (zh) * 2011-09-28 2017-03-08 Lg电子株式会社 语音信号编码方法、语音信号解码方法及使用其的装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4625286A (en) * 1982-05-03 1986-11-25 Texas Instruments Incorporated Time encoding of LPC roots
NL8500843A (nl) 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
DE69232202T2 (de) * 1991-06-11 2002-07-25 Qualcomm, Inc. Vocoder mit veraendlicher bitrate
US5704003A (en) * 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
JP4063911B2 (ja) * 1996-02-21 2008-03-19 松下電器産業株式会社 音声符号化装置
US5708757A (en) * 1996-04-22 1998-01-13 France Telecom Method of determining parameters of a pitch synthesis filter in a speech coder, and speech coder implementing such method
US5924062A (en) * 1997-07-01 1999-07-13 Nokia Mobile Phones ACLEP codec with modified autocorrelation matrix storage and search
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US5963897A (en) 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
US6094629A (en) * 1998-07-13 2000-07-25 Lockheed Martin Corp. Speech coding system and method including spectral quantizer
US6138092A (en) * 1998-07-13 2000-10-24 Lockheed Martin Corporation CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency
US6067511A (en) * 1998-07-13 2000-05-23 Lockheed Martin Corp. LPC speech synthesis using harmonic excitation generator with phase modulator for voiced speech
US6119082A (en) * 1998-07-13 2000-09-12 Lockheed Martin Corporation Speech coding system and method including harmonic generator having an adaptive phase off-setter
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6311154B1 (en) * 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US6539349B1 (en) * 2000-02-15 2003-03-25 Lucent Technologies Inc. Constraining pulse positions in CELP vocoding

Also Published As

Publication number Publication date
CN1337671A (zh) 2002-02-27
DE60101827T2 (de) 2004-12-02
US6728669B1 (en) 2004-04-27
EP1184842A3 (en) 2002-05-15
JP2002108400A (ja) 2002-04-10
DE60101827D1 (de) 2004-02-26
BR0106825A (pt) 2002-06-04
EP1184842A2 (en) 2002-03-06
CN1200404C (zh) 2005-05-04
EP1184842B1 (en) 2004-01-21
TW521265B (en) 2003-02-21
CA2350353A1 (en) 2002-02-07
KR20020012509A (ko) 2002-02-16

Similar Documents

Publication Publication Date Title
JP5027966B2 (ja) 入力信号をボコーディングする方法および装置およびそのためのコンピュータ読み出し可能信号を有する媒体を含む製造物品
JP4213243B2 (ja) 音声符号化方法及び該方法を実施する装置
JP3566652B2 (ja) 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
KR100487943B1 (ko) 음성 코딩
JP5232151B2 (ja) パケットベースのエコー除去および抑制
KR20020093940A (ko) 가변율 음성 코더에서 프레임 삭제를 보상하는 방법
EP1281172A2 (en) Method and apparatus for compression of speech encoded parameters
JPH0962299A (ja) コード励振線形予測符号化装置
JP2009541797A (ja) 種々の音声フレーム・レートの混合励振線形予測(melp)ボコーダ間でトランスコーディングするボコーダ及び関連した方法
FI118704B (fi) Menetelmä ja laite lähdekoodauksen tekemiseksi
EP2945158B1 (en) Method and arrangement for smoothing of stationary background noise
JP3357795B2 (ja) 音声符号化方法および装置
JP3964144B2 (ja) 入力信号をボコーディングする方法と装置
JP3063668B2 (ja) 音声符号化装置及び復号装置
EP1048024A1 (en) Method for speech coding under background noise conditions
JP2000209663A (ja) 音声チャネル上で非音声情報を送信する方法
JP2003522964A (ja) 背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法
JP2018511086A (ja) オーディオ信号を符号化するためのオーディオエンコーダー及び方法
US6385574B1 (en) Reusing invalid pulse positions in CELP vocoding
JP4373693B2 (ja) 音響信号の階層符号化方法および階層復号化方法
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
JPH08160996A (ja) 音声符号化装置
JP2817196B2 (ja) 音声符号化方式
JP2000101683A (ja) 音声通信装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110622

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110922

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110928

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111021

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111122

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20111122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120528

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120625

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150629

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5027966

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees