JP2002108400A - 入力信号をボコーディングする方法および装置およびそのためのコンピュータ読み出し可能信号を有する媒体を含む製造物品 - Google Patents
入力信号をボコーディングする方法および装置およびそのためのコンピュータ読み出し可能信号を有する媒体を含む製造物品Info
- Publication number
- JP2002108400A JP2002108400A JP2001239069A JP2001239069A JP2002108400A JP 2002108400 A JP2002108400 A JP 2002108400A JP 2001239069 A JP2001239069 A JP 2001239069A JP 2001239069 A JP2001239069 A JP 2001239069A JP 2002108400 A JP2002108400 A JP 2002108400A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- pulse
- track
- signal pulse
- computer readable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 230000005284 excitation Effects 0.000 claims abstract description 8
- 238000001914 filtration Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims 3
- 238000004891 communication Methods 0.000 description 23
- 239000011295 pitch Substances 0.000 description 17
- 230000003044 adaptive effect Effects 0.000 description 16
- 238000003786 synthesis reaction Methods 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 13
- 230000007774 longterm Effects 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000007906 compression Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 101100219325 Phaseolus vulgaris BA13 gene Proteins 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
Abstract
性を低減する方法を提供すること。 【解決手段】 入力信号をボコーディングするための装
置および方法は、入力信号の受信に応答して、第1の信
号パルスおよび第2の信号パルスを有するフィルタされ
た信号を生成するための線形予測フィルタと、複数のト
ラック位置を有するルックアップテーブルを有するプロ
セッサとを含む。第1の信号パルスは、第1のトラック
位置に関連づけられており、第2の信号パルスは、複数
の励起パラメータとなる第1の信号パルスに関して、第
2のトラック位置に関連づけられている。また、本発明
の装置は、プロセッサからの複数の励起パラメータの受
信に応答して、送信信号中で複数の励起パラメータを送
信する送信機を有する。
Description
特に、CELP(code excited linear prediction)ボ
コーディングに関する。
は、通信チャネルにおいて必要とされる伝送帯域幅を減
少させるために、スピーチ信号を圧縮する。通話あたり
に必要とされる伝送帯域幅を低減することにより、同じ
通信チャネルを介する通話の数を増大させることが可能
である。LPC(linear predictive coding)技法のよ
うな初期のスピーチコーディング技法は、信号の冗長性
を除去するためにフィルタを使用し、スピーチ信号を圧
縮する。LPCフィルタは、人間の音声をモデル化する
ことを試みるスペクトル包絡線を再生する。また、LP
Cフィルタは、無音声音についての雑音のような入力を
受信する一方で、鼻音および母音に対する準周期的入力
を受信することにより励起される。
on)ボコーダとして知られるクラスのボコーダが存在す
る。CELPボコーディングは、主として、4−8kb
psにおいて、他の32kbpsスピーチコーディング
技法に匹敵するスピーチ品質を達成しうるスピーチデー
タ圧縮技法である。CELPボコーダは、以前のLPC
技法に対して2つの改善を有する。第1に、CELPボ
コーダは、ピッチプレディクタ(pitch predictor)を使
用してピッチ情報を抽出することにより、より音声の詳
細を捉えることを試みる。第2に、CELPボコーダ
は、実際のスピーチ波形から作られた残留信号から得ら
れた雑音のような信号でLPCフィルタを励起する。
ーネント、1)短時間予測フィルタ(short term predic
tive filter)、2)ピッチプレディクターまたは適応形
コードブックとしても知られている長時間予測フィルタ
(long term predictive filter)、および3)固定コ
ードブックを含む。圧縮は、元のスピーチ信号を表すた
めに使用されるビット数よりも少ない所定数のビットを
各コンポーネントに割り当てることによりなされる。第
1のコンポーネントは、スピーチ信号中の短時間冗長性
を除去するために、線形予測を使用する。短時間プレデ
ィクターから生じる誤差、または残留信号は、長時間プ
レディクターに対するターゲット信号となる。
し、長時間プレディクタは、残差からピッチピリオドを
抽出し、以前のピリオドから予測されうる情報を除去す
る。長時間および短時間予測フィルタの後、得られる残
留信号は、ほとんど雑音のような信号である。アナリシ
ス・バイ・シンセサイズ(analysis-by-synthesis )を
使用して、固定コードサーチは、そのベクトルのライブ
ラリーからのエントリーと雑音のような残差を置き換え
るために、最適な一致を見出す。最適一致ベクトルを表
すコードが、雑音の多い残差の代わりに送信される。代
数的CELP(ACELP)ボコーダにおいて、固定コ
ードブックは、数個の非ゼロパルスからなり、パルスの
ロケーションおよび符号(例えば、+1または−1)に
より表現される。
は、到来スピーチ信号を複数のフレームにブロック化、
即ち分割し、短時間プレディクタのLPC係数をフレー
ム毎に一度更新する。LPC残差は、長時間プレディク
タおよび固定コードブックサーチのためにサブフレーム
に分割される。例えば、入力スピーチは、短時間プレデ
ィクタのために、160サンプルフレームにブロック化
され得る。そして、得られるフレームは、53個のサン
プル、53個のサンプル、および54個のサンプルのサ
ブフレームに分解され得る。各サブフレームは、長時間
プレディクタおよび固定コードブックサーチにより処理
される。
グルフレームの一例が示されている。スピーチ信号10
0は、異なるピッチの発声信号および非発声信号からな
る。発声信号100は、LPCフィルタを有するCEL
Pボコーダにより受信される。CELPボコーダの第1
のステップは、スピーチ信号中の短時間冗長性を除去す
ることである。短時間冗長性を除去した得られる信号
は、図2の残留スピーチ信号200である。
去することができず、フィルタされたスピーチ信号20
0中の残った準周期的ピークおよび谷は、ピッチパルス
と呼ばれる。そして、短時間予測フィルタが、スピーチ
信号200に適用されて、図3の短時間フィルタされた
信号300となる。長時間予測フィルタは、図3の残留
スピーチ信号300から準周期的ピッチパルスを除去し
て、図4の雑音に近い信号400とし、これは、固定コ
ードブックサーチのためのターゲット信号となる。図4
は、3個のサブフレーム354,356,358に分割
された固定コードブックターゲット信号350の160
サンプルフレームのプロットである。そして、コード値
は、通信ネットワークを送信される。
位置をマップするルックアップテーブル470が示され
ている。サブフレーム内のパルスは、ルックアップテー
ブル内で、16個の可能性のある位置402のうちの1
つにあるように制約される。各トラック404は16個
の可能のある位置402を有するので、各パルスロケー
ションを同定するために、4ビットのみが必要とされ
る。各パルスマッピングは、個々のトラック404にお
いて生じる。したがって、2つのトラック406,40
8が、サブフレームからの2つの信号パルスのパルス位
置のマッピングを可能にする。
4は、励起において53個のサンプルのみを有し、位置
0−52のみを有効位置とする。図5のトラック40
6,408が分割されるので、元の励起の長さを超える
位置が、各トラック中に存在する。トラック1中の位置
56および60、およびトラック2中の位置57および
61は、無効であり、不使用である。図4の最初の2個
のパルス310,312のロケーションは、サンプル1
3およびサンプル17に対応する。
り、サンプル13が、最初のトラック406中の位置3
410にあることが決定される。第2のパルスは、サ
ンプル17中にあり、位置4 412において第2のト
ラック408中にある。したがって、パルスは、それぞ
れ4ビットとして表現されかつ送信され得る。コードブ
ックは、2個のトラックのみを有するので、図4の他の
パルス314、サブフレーム354中の316,31
8,320および322は無視される。
位置により制約される。不都合なことに、CELPボコ
ーダは、パルスをトラック中の隣接位置に置く傾向にあ
る。パルスをトラック中の隣接位置に置くことにより、
発音のよりバランスしたエンコーディングではなくスピ
ーチ音の開始がエンコードされる。また、ボコーダに対
するビットレートが減少し、かつより少ないパルスが使
用されるので、音声品質は、パルスのトラック中への非
効率的な配置により悪影響を受ける。
位置に配置される可能性を低減する方法が必要とされて
いる。
パルスの位置に対して、第2のトラック中の信号パルス
の配置を実行することにより、絶対的トラック位置配置
の非効率さが除去される。信号パルスのエンコーディン
グの間に、N+1個のトラック中のN+1個の信号パル
スの相対配置を実行することで、デコードされた信号の
信号品質が増大する。増大した信号品質は、トラック中
にパルスをより正確に配置することにより、かつトラッ
ク内の信号パルス位置の隣接配置の発生を低減すること
により、達成される。
置が制約された2トラックコードブックテーブルが示さ
れている。テーブル500は、各トラックに対して16
個の可能性のある信号パルス位置506を同定する2個
のパルス位置トラック502,504(共通的に“トラ
ック”と呼ぶ)を含む。トラック1 502およびトラ
ック2504中の固定コードブックエントリーゼロない
し13 508が、可能性のある有効パルス位置であ
る。
510および15 512は、両方のトラックにおい
て不使用である。また、第1のトラック中の可能性ある
第1のパルス位置は、4により分割可能なパルス位置
(即ち、0,4,8,…,52)にあるように制約され
る。第2のトラック中の第2のパルス位置は、第1のト
ラック中の第1の信号パルスのインデックス位置506
に関連している。
ンコードするのではなく、第2の信号パルスの相対的ポ
ジショニングが起きる。トラック中でエンコードされる
隣接信号パルスをより少なくすることにより、信号パル
スが、ボコーダによりデコードされる信号の音声品質を
改善するバーストエネルギの再生をよりよく可能にす
る。単一信号パルスが、この実施形態において、2個の
トラック502および504の各々においてエンコード
される。第1のトラック中の第1の信号パルスに関連し
て第2のトラック中の第2の信号パルスを配置すること
により、デコードされた発声の品質が増大する。代替的
な実施形態において、コードブックテーブルは、2個よ
り多いトラックを含み、トラック中の追加的信号パルス
が、以前の信号パルスの以前のトラック位置に関連す
る。
の第2の信号パルスの相対的ロケーションは、第1のト
ラック中の第1の信号パルスに関連する。代替的な実施
形態において、第2のトラック中の第2の信号パルスの
相対位置は、第1のシングルパルスサンプル位置に関連
する。さらに別の実施形態において、第2のトラック中
の信号パルス位置は、逐次的でない順序(即ち、1,−
1,7,−7,2,−2,6,−6,3,−3,5,−
5,4,−4)でグループ化され得る。
び受信機デバイス604を有する通信システム605が
示されている。送信機および受信機通信デバイス60
2,604が、通信パス606により一緒に結合されて
いる。通信パス606は、選択的に、ローカルエリアネ
ットワーク、ワイドエリアネットワーク、インターネッ
ト、ATMネットワーク、または公衆電話網のようなワ
イヤベースドネットワーク、またはセルラ、マイクロウ
ェーブまたはサテライトネットワークのようなワイヤレ
スネットワークであり得る。通信パス606の主要な要
求条件は、送信機602と受信機604との間でデジタ
ルデータを転送する能力である。
号入力/出力ユニット608,610を有する。ユニッ
ト608,610は、送信機デバイス602および受信
機デバイス604へ/からアナログ音声信号を転送する
電話デバイスとして示されている。信号入力/出力ユニ
ット608は、2ワイヤ通信パス612により送信機デ
バイス602に結合されている。同様に、他の信号入力
/出力ユニット610は、別の2ワイヤ通信パス614
を介して受信機デバイス604に結合されている。代替
的な実施形態において、信号入力ユニットは、送信およ
び受信通信デバイスに内蔵されている(即ち、送信およ
び受信デバイスに組み込まれたスピーカおよびマイクロ
ホン)か、またはワイヤレス通信パスを介して通信する
(即ち、コードレス電話機)。
ス612に結合されたアナログ信号ポート616、CE
LPボコーダ618、およびコントローラ620を含
む。コントローラ620は、アナログ信号ポート61
6、ボコーダ618、およびネットワークインターフェ
ース622に結合されている。また、ネットワークイン
ターフェース622は、ボコーダ618、コントローラ
620、通信パス606に結合されている。
ントローラ626に結合された別のネットワークインタ
ーフェース624、通信パス604、および別のボコー
ダ628を有する。他のコントローラ626が、他のボ
コーダ628、他のネットワークインターフェース62
4、別のアナログ信号ポート630に結合されている。
また、他のアナログ信号ポート630が、他の2ワイヤ
通信パス614に結合されている。
て、信号入力デバイス608から受信される。コントロ
ーラ620は、送信機デバイス602のための制御およ
びタイミング信号を提供し、アナログポート161が受
信された信号をボコーダ618へ信号圧縮のために転送
することを可能にする。ボコーダ618は、受信された
信号を圧縮するために、図6に示されたデータ構造を備
えた固定コードブックを有する。図6のデータ構造50
0は、フィルタされた信号からの第1の信号パルスを、
第1のトラック内のパルス位置に関連づける。また、第
2の信号パルスは、第2のパルス位置に関連づけられ、
第1のトラック中の第1の信号パルスの第1のパルス位
置に関連して決定される。
連して割り当てることにより、トラック中で2つの信号
パルスは隣接して割当てられることが防止される。第1
の信号パルスは、エンコードされて、第1のトラック5
02中のパルス位置に割り当てられ、第2のトラック5
04中の第2の信号パルスのパルス位置が、第1のトラ
ック502に関連してエンコードされる。第2のパルス
位置の相関的エンコーディングは、圧縮された信号が、
第1のパルス位置が第2のパルス位置に隣接しないとい
うより高い可能性を有する結果となる。そして、圧縮さ
れた信号は、図7のボコーダ618から、ネットワーク
インターフェース622へ送られる。ネットワークイン
ターフェース622は、圧縮された信号を、通信パス6
06を介して受信機デバイス604へ送信する。
ネットワークインターフェース624は、圧縮信号を受
信する。受信機コントローラ626は、受信された圧縮
信号が受信機ボコーダ628に転送されることを可能に
する。受信機ボコーダ628は、図6のルックアップテ
ーブル500を使用することにより、圧縮信号をデコー
ドする。図7のボコーダ628は、図6のルックアップ
テーブル500を使用して、受信された圧縮信号からア
ナログ信号を再生成する。ルックアップテーブルは、固
定コードブックコントレビューションを再生成し、そし
て、長時間および短時間プレディクターによりフィルタ
される。アナログ信号は、図7の受信機アナログ信号ポ
ート630を介して、受信機信号入力/出力デバイス6
10へ送られる。
グスピーチ信号の信号処理が示されている。プリプロセ
ッサ710は、アナログ信号を受信するための入力を有
し、LPフィルタ714および信号コンバイナ712に
結合されている。信号コンバイナ712は、プリプロセ
ッサ710および合成フィルタ716からの信号を結合
する。信号コンバイナ712の出力は、知覚的重み付け
プロセッサ718に結合されている。合成フィルタ71
6は、LP分析フィルタ714、信号コンバイナ71
2、別の信号コンバイナ720、適応形コードブック7
32、およびピッチアナライザ722に結合されてい
る。
けプロセッサ718、固定コードブックサーチ734、
適応形コードブック732、合成フィルタ716、他の
信号コンバイナ720、およびパラメータエンコーダ7
24に結合されている。パラメータエンコーダ724
は、送信機728、固定コードブックサーチ734、固
定コードブック730、LPフィルタ714、およびピ
ッチアナライザ722に結合されている。
608からプリプロセッサ710において受信される。
図8のプリプロセッサ710は、信号を処理し、利得お
よび他の信号特性を調節する。そして、プリプロセッサ
710からの信号は、LP分析フィルタ714および信
号コンバイナ712の両方に経路選択される。LP分析
フィルタ714により生成される係数情報は、合成フィ
ルタ716、知覚的重み付けプロセッサ718、および
パラメータエンコーダ724に送られる。合成フィルタ
716は、LPフィルタ714からのLP係数情報およ
び他の信号コンバイナ720からの信号を受信する。
デル化する合成フィルタ716は、信号コンバイナ71
2によりプリプロセッサ710の出力と結合される信号
を生成する。信号コンバイナ712から得られる信号
は、知覚的重み付けプロセッサ718によりフィルタさ
れる。知覚的重み付けプロセッサ718は、LPフィル
タ714からのLP係数情報も受信する。知覚的重み付
けプロセッサ718は、コーディング歪みが、高いスピ
ーチエネルギを含む周波数において信号スペクトルを増
幅し、より低いスピーチエネルギを含む周波数を減衰さ
せることにより有効に「マスクされる」ポストフィルタ
である。
は、固定コードブックサーチ734およびピッチアナラ
イザ722に送られる。固定コードブックサーチ734
は、パラメータエンコーダ724および固定コードブッ
ク730に送られるコード値を生成する。固定コードブ
ックサーチ734は、固定コードブック734と分離し
て示されているが、代替的に、固定コードブック730
に含めることができ、別個に構成される必要はない。ま
た、固定コードブックサーチは、図6のルックアップテ
ーブル500のデータ構造へのアクセスを有し、第1の
パルス位置に関連する第2のパルス位置の決定は、エン
コードされるべきより正確なパルス信号情報を可能に
し、コードブックエンコーディング隣接パルスの発生を
減少させる。
ータエンコーダ724および適応形コードブック732
へ送られるピッチデータを生成する。適応形コードブッ
ク732は、ピッチアナライザ722からのピッチデー
タおよび信号コンバイナ720からのフィードバック信
号を受信し、スピーチ信号の長時間(即ち、周期的)成
分をモデル化する。適応形コードブック信号の出力は、
信号コンバイナ720により、固定コードブック730
の出力と結合される。
ックサーチ734により生成されたコード値を受信し、
信号を再生成する。生成された信号は、信号コンバイナ
720により適応形コードブック732からの信号と結
合される。得られる結合信号は、スピーチ信号の短時間
スペクトル形状をモデル化するために、合成フィルタ7
16により使用され、適応形コードブック732へフィ
ードバックされる。
クサーチ734、ピッチアナライザ722、およびLP
フィルタ714からのパラメータを受信する。受信され
たパラメータを使用するパラメータエンコーダは、圧縮
信号を生成する。そして、圧縮信号は、ネットワークを
介して送信機728により送信される。
て、ボコーダのエンコーダおよびデコーダ部は、デジタ
ルアンサリングマシンのような同じデバイス中に存在す
る。そのような実施形態における通信パスは、圧縮信号
がメモリに記憶されかつこれから検索されることを可能
にするデータバスである。
CELPボコーダを有する受信機デバイスの図が示され
ている。受信機デバイス604は、受信機802に結合
されたネットワークインターフェース661を有する。
固定コードブック804は、受信機802およびゲイン
ファクタ“c”812に結合されている。信号コンバイ
ナ806は、合成フィルタ808、ゲインファクタ
“p”811およびゲインファクタ“c”812に結合
されている。適応形コードブック810は、ゲインファ
クタ“p”811および信号コンバイナ806の出力に
結合されている。合成フィルタ808は、信号コンバイ
ナ806および知覚的ポストフィルタ814の出力に接
続されている。知覚的ポストフィルタは、他のアナログ
ポート630および合成フィルタ808に結合されてい
る。
616において、受信機デバイス604により受信され
る。受信機802は、ネットワークインターフェース6
16において受信された圧縮信号からデータをアンパッ
ク(unpack)する。データは、固定コードブックインデ
ックス、固定コードブックゲイン、適応形コードブック
インデックス、適応形コードブックゲインおよびLP係
数に対するインデックスからなる。固定コードブック8
04は、図6のルックアップテーブル500のデータ構
造を含む。
ンバイナ806により、適応形コードブック810およ
びゲインファクタ812からの信号と結合される信号を
生成する。そして、信号コンバイナ806からの結合信
号は、合成フィルタ808において受信され、適応形コ
ードブック810にフィードバックされる。合成フィル
タ808は、スピーチ信号を再生成するために結合信号
を使用する。再生成されたスピーチ信号は、スピーチ信
号を調節する知覚的ポストフィルタ814を通過させら
れる。そして、スピーチ信号は、アナログポート630
により、同様のコードブックを有する受信機へ送られ
る。
るN+1トラック中のパルス位置を有するルックアップ
テーブルまたはコードブックを使用するボコーディング
の方法のフローチャートが示されている。ステップ90
2において、入力信号(例えば、アナログ音声信号)
が、図7の受信機デバイス604において受信される。
入力信号は、図10のステップ903において信号フレ
ームに分割され、個別の信号部分が処理され得る。各信
号フレームは、図10のステップ904において、図8
のフィルタ714により処理され、残留信号と呼ばれる
フィルタされた入力信号となる。
ップ906において、長時間フィルタによりさらにフィ
ルタされ、図8の適応形コードブック732は、信号パ
ルスを有するフィルタされた入力信号から長時間信号冗
長性を変換または除去する。図10のステップ908に
おいて、固定コードブックインデックスは、第1のトラ
ック内の第1の信号パルスのロケーションを同定する。
図8の固定コードブック730は、図6のルックアップ
テーブル500および第1のトラック中の第1のパルス
位置への第2のトラック中の第2のパルス位置の相対マ
ッピングを含む。ステップ909において、第2のパル
ス位置のオフセットは、第1のパルス位置に関して決定
され、第2のパルスの配置をより正確にする。
残りのパルス信号を表すバイナリパターンを生成するた
めに、図8の固定コードブック730により使用され
る。バイナリパターンは、図10のステップ910にお
いて、パルス位置のインデックスを含む信号にエンコー
ドされる。そして、エンコードされた信号は、ステップ
912において、通信パスを介して送信される。
成されたCELPボコーダを作るために、汎用デジタル
シグナルプロセッサを他の電子的要素と組み合わせるこ
とを可能にする。したがって、コンピュータで読み出し
可能な信号を有する媒体は、コードブック中のパルス位
置を制限するための更なる制約を有するボコーダを具現
化するためのソフトウェアコードを含み得る。
パルスが隣接トラック位置に配置される可能性を低減す
る方法を提供することができる。
ムを示す図。
チフレームを示す図。
ルスピーチフレームを構成する既知の方法を示す図。
に制約される信号パルスを有する既知のCELPボコー
ダコードブックルックアップテーブルを示す図。
置を有するCELPボコーダコードブックを示す図。
ングを使用する送信デバイスおよび受信デバイスを備え
た通信システムを示す図。
ドするCELPボコーダを有する送信デバイスを示す
図。
有する受信デバイスを示す図。
ディングする方法を示すフローチャート。
22 パルス 350 固定コードブックターゲット信号 354,356,358 サブフレーム 400 雑音に近い信号 404,406,408 トラック 470 ルックアップテーブル 500 データ構造 600 通信システム 602 送信機デバイス 604 受信機デバイス 606,612,614 通信パス 608 信号入力ユニット 610 信号出力ユニット 616,630 アナログ信号ポート 618 CELPボコーダ 620,626 コントローラ 622,624 ネットワークインターフェース 628 ボコーダ 710 プロセッサ 712 信号コンバイナ 714 LPフィルタ 716 合成フィルタ 718, 808 知覚的重み付けプロセッサ 720,806 信号コンバイナ 722 ピッチアナライザ 724 パラメータエンコーダ 728 送信機 731 ゲインファクタ“C” 733 ゲインファクタ“P” 732,810 適応形コードブック 734 固定コードブックサーチ 802 受信機 804 固定コードブック 814 知覚的ポストフィルタ
Claims (16)
- 【請求項1】 第1の信号パルスおよび第2の信号パル
スを有するフィルタされた信号を得るために、入力信号
をフィルタリングするステップと、 前記第1の信号パルスを、データ構造の第1のトラック
内の第1のパルス位置と関連づけることにより、前記第
1の信号パルスをエンコードするステップと、前記デー
タ構造の第2のトラック内の第1のパルス位置に関し
て、第2の信号パルスを第2のパルス位置に割当てるス
テップとを有することを特徴とする入力信号をボコーデ
ィングする方法。 - 【請求項2】 前記フィルタリングするステップが、前
記信号を線形予測フィルタで処理するステップをさらに
含むことを特徴とする請求項1記載の方法。 - 【請求項3】 前記信号を複数の信号フレームに分割す
るステップをさらに含むことを特徴とする請求項1記載
の方法。 - 【請求項4】 前記分割するステップが、アナログ信号
を受信するステップとさらに含むことを特徴とする請求
項3記載の方法。 - 【請求項5】 前記分割するステップが、デジタル信号
を受信するステップをさらに含むことを特徴とする請求
項3記載の方法。 - 【請求項6】 前記割当てるステップが、前記第1の信
号パルスから前記第2の信号パルスのオフセットを同定
するステップをさらに含むことを特徴とする請求項1記
載の方法。 - 【請求項7】 前記同定するステップが、前記第2の信
号パルス位置から前記第1の信号パルス位置のオフセッ
トを計算するステップをさらに含むことを特徴とする請
求項6記載の方法。 - 【請求項8】 入力信号の受信に応答して、少なくとも
第1の信号パルスおよび第2の信号パルスを有するフィ
ルタされた信号を生成するための線形予測フィルタと、 第1の信号パルスが第1の複数のトラック位置中の第1
のトラック位置に割り当てられ、第2の信号パルスが複
数の励起パラメータになる第1の信号パルスの第1のト
ラック位置に関して、第2の複数のパルス位置中の第2
のトラック位置に割り当てられる複数のトラック位置を
有するルックアップテーブルを有するプロセッサと、 前記プロセッサからの複数の励起パラメータの受信に応
答して、送信信号において複数の励起パラメータを送信
する送信機とを有することを特徴とする入力信号をボコ
ーディングするための装置。 - 【請求項9】 入力ポートの入力ポート受信に応答し
て、入力信号を入力信号フレームに分割するためのメモ
リバッファを有する入力ポートをさらに含むことを特徴
とする請求項8記載の装置。 - 【請求項10】 前記プロセッサは、前記フィルタされ
た信号中の前記第1の信号パルスから前記第2の信号パ
ルスのオフセットを決定することを特徴とする請求項8
記載の装置。 - 【請求項11】 前記プロセッサは、前記第1のトラッ
ク位置から前記第2の信号パルスのオフセットを決定す
ることを特徴とする請求項8記載の装置。 - 【請求項12】 前記入力信号は、入力アナログ信号で
あることを特徴とする請求項8記載の装置。 - 【請求項13】 前記入力信号がデジタル信号であるこ
とを特徴とする請求項8記載の装置。 - 【請求項14】 信号のボコーディングのためにその中
に具現化されたコンピュータ読み出し可能なプログラム
コード手段を有するコンピュータ読み出し可能信号を有
する媒体を含む製造物品において、 前記コンピュータ読み出し可能プログラムコード手段
が、第1の信号パルスおよび第2の信号パルスを有する
フィルタされた信号を得るために、前記入力信号をフィ
ルタするための第1のコンピュータ読み出し可能プログ
ラムコードを有する手段と、 前記第1の信号パルスをデータ構造の第1のトラック内
の第1のパルス位置に関連づけることにより、前記第1
の信号パルスをエンコードするための第2のコンピュー
タ読み出し可能プログラムコードを有する手段と、 前記データ構造の第2のトラック内の第1のパルス位置
に関して、前記第2の信号パルスを前記パルス位置に割
り当てるための第3のコンピュータ読み出し可能プログ
ラムコードを有する手段とを有することを特徴とする製
造物品。 - 【請求項15】 前記コンピュータ読み出し可能プログ
ラムコード手段が、前記第1の信号パルスから前記第2
の信号パルスのオフセットを同定するための第4のコン
ピュータ読み出し可能プログラムコード手段を有するこ
とを特徴とする請求項14記載の製造物品。 - 【請求項16】 前記第4のコンピュータ読み出し可能
プログラムコード手段が、第2の信号パルス位置から前
記第1の信号パルス位置のオフセットを計算するための
コンピュータ読み出し可能プログラムコード手段をさら
に含むことを特徴とする請求項15記載の製造物品。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/633,465 US6728669B1 (en) | 2000-08-07 | 2000-08-07 | Relative pulse position in celp vocoding |
US09/633465 | 2000-08-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002108400A true JP2002108400A (ja) | 2002-04-10 |
JP5027966B2 JP5027966B2 (ja) | 2012-09-19 |
Family
ID=24539732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001239069A Expired - Fee Related JP5027966B2 (ja) | 2000-08-07 | 2001-08-07 | 入力信号をボコーディングする方法および装置およびそのためのコンピュータ読み出し可能信号を有する媒体を含む製造物品 |
Country Status (9)
Country | Link |
---|---|
US (1) | US6728669B1 (ja) |
EP (1) | EP1184842B1 (ja) |
JP (1) | JP5027966B2 (ja) |
KR (1) | KR20020012509A (ja) |
CN (1) | CN1200404C (ja) |
BR (1) | BR0106825A (ja) |
CA (1) | CA2350353A1 (ja) |
DE (1) | DE60101827T2 (ja) |
TW (1) | TW521265B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014505434A (ja) * | 2011-01-26 | 2014-02-27 | ▲ホア▼▲ウェイ▼技術有限公司 | ベクトル結合符号化/復号方法および符号復号器 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6980948B2 (en) * | 2000-09-15 | 2005-12-27 | Mindspeed Technologies, Inc. | System of dynamic pulse position tracks for pulse-like excitation in speech coding |
US6847929B2 (en) * | 2000-10-12 | 2005-01-25 | Texas Instruments Incorporated | Algebraic codebook system and method |
KR100503414B1 (ko) * | 2002-11-14 | 2005-07-22 | 한국전자통신연구원 | 고정 코드북의 집중 검색 방법 및 장치 |
US20040208169A1 (en) * | 2003-04-18 | 2004-10-21 | Reznik Yuriy A. | Digital audio signal compression method and apparatus |
US7742926B2 (en) | 2003-04-18 | 2010-06-22 | Realnetworks, Inc. | Digital audio signal compression method and apparatus |
ES2291939T3 (es) * | 2003-09-29 | 2008-03-01 | Koninklijke Philips Electronics N.V. | Codificacion de señales de audio. |
US8502706B2 (en) * | 2003-12-18 | 2013-08-06 | Intel Corporation | Bit allocation for encoding track information |
KR100723400B1 (ko) | 2004-05-12 | 2007-05-30 | 삼성전자주식회사 | 복수의 룩업테이블을 이용한 디지털 신호 부호화 방법 및장치 |
SG123639A1 (en) * | 2004-12-31 | 2006-07-26 | St Microelectronics Asia | A system and method for supporting dual speech codecs |
US7224295B2 (en) * | 2005-07-11 | 2007-05-29 | Mediatek Inc. | System and method for modulation and demodulation using code subset conversion |
KR100900438B1 (ko) * | 2006-04-25 | 2009-06-01 | 삼성전자주식회사 | 음성 패킷 복구 장치 및 방법 |
US8688437B2 (en) | 2006-12-26 | 2014-04-01 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
CN101286321B (zh) * | 2006-12-26 | 2013-01-09 | 华为技术有限公司 | 双脉冲激励的线性测编码 |
JP5981909B2 (ja) * | 2011-06-15 | 2016-08-31 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | パルス位置探索装置、符号帳探索装置、及びこれらの方法 |
WO2013002696A1 (en) | 2011-06-30 | 2013-01-03 | Telefonaktiebolaget Lm Ericsson (Publ) | Transform audio codec and methods for encoding and decoding a time segment of an audio signal |
CN103946918B (zh) * | 2011-09-28 | 2017-03-08 | Lg电子株式会社 | 语音信号编码方法、语音信号解码方法及使用其的装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1097294A (ja) * | 1996-02-21 | 1998-04-14 | Matsushita Electric Ind Co Ltd | 音声符号化装置 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4625286A (en) * | 1982-05-03 | 1986-11-25 | Texas Instruments Incorporated | Time encoding of LPC roots |
NL8500843A (nl) | 1985-03-22 | 1986-10-16 | Koninkl Philips Electronics Nv | Multipuls-excitatie lineair-predictieve spraakcoder. |
US5754976A (en) | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
DE69232202T2 (de) * | 1991-06-11 | 2002-07-25 | Qualcomm, Inc. | Vocoder mit veraendlicher bitrate |
US5704003A (en) * | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
US5708757A (en) * | 1996-04-22 | 1998-01-13 | France Telecom | Method of determining parameters of a pitch synthesis filter in a speech coder, and speech coder implementing such method |
US5924062A (en) * | 1997-07-01 | 1999-07-13 | Nokia Mobile Phones | ACLEP codec with modified autocorrelation matrix storage and search |
WO1999010719A1 (en) * | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
US5963897A (en) | 1998-02-27 | 1999-10-05 | Lernout & Hauspie Speech Products N.V. | Apparatus and method for hybrid excited linear prediction speech encoding |
US6094629A (en) * | 1998-07-13 | 2000-07-25 | Lockheed Martin Corp. | Speech coding system and method including spectral quantizer |
US6138092A (en) * | 1998-07-13 | 2000-10-24 | Lockheed Martin Corporation | CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency |
US6067511A (en) * | 1998-07-13 | 2000-05-23 | Lockheed Martin Corp. | LPC speech synthesis using harmonic excitation generator with phase modulator for voiced speech |
US6119082A (en) * | 1998-07-13 | 2000-09-12 | Lockheed Martin Corporation | Speech coding system and method including harmonic generator having an adaptive phase off-setter |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
US6311154B1 (en) * | 1998-12-30 | 2001-10-30 | Nokia Mobile Phones Limited | Adaptive windows for analysis-by-synthesis CELP-type speech coding |
US6539349B1 (en) * | 2000-02-15 | 2003-03-25 | Lucent Technologies Inc. | Constraining pulse positions in CELP vocoding |
-
2000
- 2000-08-07 US US09/633,465 patent/US6728669B1/en not_active Expired - Lifetime
-
2001
- 2001-06-13 CA CA002350353A patent/CA2350353A1/en not_active Abandoned
- 2001-07-02 EP EP01305719A patent/EP1184842B1/en not_active Expired - Lifetime
- 2001-07-02 DE DE60101827T patent/DE60101827T2/de not_active Expired - Lifetime
- 2001-07-31 BR BR0106825-3A patent/BR0106825A/pt not_active Application Discontinuation
- 2001-08-02 TW TW090118919A patent/TW521265B/zh active
- 2001-08-06 KR KR1020010047214A patent/KR20020012509A/ko not_active Application Discontinuation
- 2001-08-06 CN CNB011245921A patent/CN1200404C/zh not_active Expired - Fee Related
- 2001-08-07 JP JP2001239069A patent/JP5027966B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1097294A (ja) * | 1996-02-21 | 1998-04-14 | Matsushita Electric Ind Co Ltd | 音声符号化装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014505434A (ja) * | 2011-01-26 | 2014-02-27 | ▲ホア▼▲ウェイ▼技術有限公司 | ベクトル結合符号化/復号方法および符号復号器 |
US8930200B2 (en) | 2011-01-26 | 2015-01-06 | Huawei Technologies Co., Ltd | Vector joint encoding/decoding method and vector joint encoder/decoder |
US9404826B2 (en) | 2011-01-26 | 2016-08-02 | Huawei Technologies Co., Ltd. | Vector joint encoding/decoding method and vector joint encoder/decoder |
KR20170053749A (ko) * | 2011-01-26 | 2017-05-16 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 벡터 조인트 인코딩/디코딩 방법 및 벡터 조인트 인코더/디코더 |
JP2017112626A (ja) * | 2011-01-26 | 2017-06-22 | ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. | ベクトル結合符号化/復号方法および符号復号器 |
US9704498B2 (en) | 2011-01-26 | 2017-07-11 | Huawei Technologies Co., Ltd. | Vector joint encoding/decoding method and vector joint encoder/decoder |
US9881626B2 (en) | 2011-01-26 | 2018-01-30 | Huawei Technologies Co., Ltd. | Vector joint encoding/decoding method and vector joint encoder/decoder |
US10089995B2 (en) | 2011-01-26 | 2018-10-02 | Huawei Technologies Co., Ltd. | Vector joint encoding/decoding method and vector joint encoder/decoder |
KR102017721B1 (ko) | 2011-01-26 | 2019-09-03 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 벡터 조인트 인코딩/디코딩 방법 및 벡터 조인트 인코더/디코더 |
Also Published As
Publication number | Publication date |
---|---|
CN1337671A (zh) | 2002-02-27 |
DE60101827T2 (de) | 2004-12-02 |
US6728669B1 (en) | 2004-04-27 |
EP1184842A3 (en) | 2002-05-15 |
DE60101827D1 (de) | 2004-02-26 |
BR0106825A (pt) | 2002-06-04 |
EP1184842A2 (en) | 2002-03-06 |
CN1200404C (zh) | 2005-05-04 |
JP5027966B2 (ja) | 2012-09-19 |
EP1184842B1 (en) | 2004-01-21 |
TW521265B (en) | 2003-02-21 |
CA2350353A1 (en) | 2002-02-07 |
KR20020012509A (ko) | 2002-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4213243B2 (ja) | 音声符号化方法及び該方法を実施する装置 | |
US5778335A (en) | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding | |
JP5027966B2 (ja) | 入力信号をボコーディングする方法および装置およびそのためのコンピュータ読み出し可能信号を有する媒体を含む製造物品 | |
KR100487943B1 (ko) | 음성 코딩 | |
KR20010099763A (ko) | 광대역 신호들의 효율적 코딩을 위한 인식적 가중디바이스 및 방법 | |
JP2002202799A (ja) | 音声符号変換装置 | |
JP2000187496A (ja) | デジタル無線チャネル上の自動音声/話者認識 | |
JPH0962299A (ja) | コード励振線形予測符号化装置 | |
EP1671317B1 (en) | A method and a device for source coding | |
JP3357795B2 (ja) | 音声符号化方法および装置 | |
EP1301018A1 (en) | Apparatus and method for modifying a digital signal in the coded domain | |
JPH1097295A (ja) | 音響信号符号化方法及び復号化方法 | |
JP2002268696A (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
JP3964144B2 (ja) | 入力信号をボコーディングする方法と装置 | |
JP3063668B2 (ja) | 音声符号化装置及び復号装置 | |
EP1020848A2 (en) | Method for transmitting auxiliary information in a vocoder stream | |
EP1298647B1 (en) | A communication device and a method for transmitting and receiving of natural speech, comprising a speech recognition module coupled to an encoder | |
US6385574B1 (en) | Reusing invalid pulse positions in CELP vocoding | |
JP2853170B2 (ja) | 音声符号化復号化方式 | |
JPH05165497A (ja) | コード励振線形予測符号化器及び復号化器 | |
KR20050007854A (ko) | 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법 | |
JP3350340B2 (ja) | 音声符号化方法および音声復号化方法 | |
JP3250398B2 (ja) | 線形予測係数分析装置 | |
JPH08160996A (ja) | 音声符号化装置 | |
JP2817196B2 (ja) | 音声符号化方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110622 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110922 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110928 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111021 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111122 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120507 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120528 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120625 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150629 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5027966 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |