JP2832871B2 - 音声信号の組み込み式コード化システム - Google Patents
音声信号の組み込み式コード化システムInfo
- Publication number
- JP2832871B2 JP2832871B2 JP3350519A JP35051991A JP2832871B2 JP 2832871 B2 JP2832871 B2 JP 2832871B2 JP 3350519 A JP3350519 A JP 3350519A JP 35051991 A JP35051991 A JP 35051991A JP 2832871 B2 JP2832871 B2 JP 2832871B2
- Authority
- JP
- Japan
- Prior art keywords
- excitation
- signal
- filtering
- excitation signal
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 title claims description 27
- 230000005284 excitation Effects 0.000 claims description 157
- 238000001914 filtration Methods 0.000 claims description 73
- 238000003786 synthesis reaction Methods 0.000 claims description 45
- 230000015572 biosynthetic process Effects 0.000 claims description 43
- 230000015654 memory Effects 0.000 claims description 40
- 238000000034 method Methods 0.000 claims description 34
- 230000005540 biological transmission Effects 0.000 claims description 32
- 230000007774 longterm Effects 0.000 claims description 22
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 9
- 230000003595 spectral effect Effects 0.000 claims description 9
- 239000002131 composite material Substances 0.000 claims description 5
- 101001106432 Homo sapiens Rod outer segment membrane protein 1 Proteins 0.000 claims description 3
- 102100021424 Rod outer segment membrane protein 1 Human genes 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000007493 shaping process Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 2
- 230000001629 suppression Effects 0.000 claims 1
- 239000013598 vector Substances 0.000 description 32
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000015556 catabolic process Effects 0.000 description 7
- 238000006731 degradation reaction Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 4
- 230000001755 vocal effect Effects 0.000 description 3
- 101100421779 Arabidopsis thaliana SNL3 gene Proteins 0.000 description 2
- 101000652736 Homo sapiens Transgelin Proteins 0.000 description 2
- 101150065817 ROM2 gene Proteins 0.000 description 2
- 101100042631 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SIN3 gene Proteins 0.000 description 2
- 101100421709 Schistosoma mansoni SM21.7 gene Proteins 0.000 description 2
- 102100031013 Transgelin Human genes 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Use Of Switch Circuits For Exchanges And Methods Of Control Of Multiplex Exchanges (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Description
ステムに関し、とりわけ、合成による分析技術を使用し
た組み込み式のサブコードを有するデジタル・コード化
システムに係る。
タル・コード化』または、より簡潔に『組み込み式のコ
ード化』なる表現は、コード化信号を形成するビット・
フロー内に、デコード化がなお可能で、元の信号のおお
よそのレプリカを与える、より低速のフローが存在する
ことを示している。前記コードは、伝送されるビット・
フローの偶然の部分的損失に対処出来るばかりでなく、
伝送される情報量の一時的制限の必要性にも対処出来
る。後者の状況は、パケット交換網の過負荷の場合に生
じ、例えば、所謂『非同期転送モード』(ATM)にお
いては、レート制限がパケットまたは各パケットにおけ
るビット数を落とすことにより達成される。組み込み式
のコードを使用することにより、転送先ノードで原信号
が、全てのビットまたはパケット・フローの受信の場合
と比べるといくらか劣化しているにしても、回復され
る。この解決法は、適切なレートで動作して伝送レート
の選択のためのネットワーク・シグナリングにより駆動
される異なる構造を有するコーダー/デコーダーのセッ
トを使用するより簡単である。
の中で、PCM(より特定的には、サンプル・サイン・
コード化および振幅コード化を用いる均等PCM)は、
それ自体組み込み式のコードである。これは、コードワ
ードにおいて、より大きい又はより小さい数のビットを
使用することで、サンプル値のより正確な再構成が決め
られるからである。例えば、DPCM(差動PCM)お
よびADPCM(アダプチブ差動PCM)のような他の
システムでは、現在の情報をデコード化するのに過去の
情報を利用しており、例えば、合成による分析コード化
システムのようなベクトル量子化に基づくシステムで
は、基本的に組み込み式のコード化でなく、実際、幾つ
かの数のコード化ビットが損失することにより、再構成
された信号の質が大きく劣化する。
良された、DPCMまたはADPCMに基づくコード化
・デコード化装置が、文献に記載されている。例えばグ
ッドマン(D.J.Goodman)によりカンファレ
ンスICC−80,論文42−2に寄稿された『可変ビ
ット・レート伝送のための組み込み式DPCM』と題す
る論文にはDPCMコーダー・デコーダーが記述され、
そこではコード化されるべき信号が、ライン上に公称伝
送レートを生じるような数のレベルで量子化され、一方
反転量子化装置が、予想される最小伝送レートに対応す
る数のレベルで動作している。そのため、コーダーおよ
びデコーダー中のプレディクタ(predictor)
は、同一の量子化ステップで量子化された同一の信号上
で動作する。得られた質の劣化は、在来形のDPCMコ
ード化伝送における、同一の数のビット損失の場合に生
じるものより低いことが判つた。この論文はまた、同一
コンセプトの音声パケット伝送への使用を示唆してい
る。それは、ビット落ちによる劣化は、パケット損失に
よる劣化より十分小さいからである。このパケット損失
が、苛酷な通信条件の下で伝送レートを低下させる通常
の方法なのである。
on)およびロックハート(G.B.Lockhar
t)により1990年9月18〜21日バルセロナにお
いて開催された第5回ヨーロッパ信号処理会議(EUS
IPCO−90)に提出された『新規パケット・ベース
組み込み式のコーダーを使用した低ビット・レート・コ
ード化音声信号の損失パケット回復』と題する論文に
は、音声信号の組み込み式コード化システムが記述され
ているが、それはまさしく、個々のビットでなく全パケ
ットの損失または落としの場合の劣化を制限するため
に、パケット伝送について研究されたものである。その
コーダーの一般的構成は、基本的に上記グッドマン
(D.J.Goodman)論文に記載された組み込み
式DPCMコーダーを再現したものである。このシステ
ムは、パケットの『不可欠』および『補充』と言うよう
な分類に基づいており、そのネットワークは、過負荷の
場合、補充パケットを優先的に落とす。このような分類
については、現在のパケットが、受信機での再構成から
生じるであろうところの劣化を決定するため、その予測
と比較され、その劣化は、『再構成指数』によつて表現
される。この再構成指数は、次いでしきい値と比較され
る。若し、この比較が高い劣化を示す、つまりパケット
の再構成が困難であれば、そのパケットは『不可欠』と
分類され、そうでなければ『補充』と分類される。この
2種のパケット・タイプは、コード化され正常にネット
ワークを通じて伝送される。この『不可欠パケット』ま
たは『補充パケット』の決定は、送信機および受信機で
の適切なスイッチの位置を、送信機においては、補充パ
ケットの送信後、もとのものの代わりに予測パケットが
コード化され、コード化パケットを、続くパケットを予
測するために、局所デコーダーおよび局所プレデイクタ
に供給するように決定する。受信機においては、不可欠
パケットは正常にデコード化され、出力に供給される。
また、局所エンコーダーも、局所プレデイクタで予測さ
れたパケットを使用して、パケットが失なわれた場合の
デコーダー・パラメータを更新するために設けられてい
る。補充パケットも、正常にデコード化され出される
が、それは、そこでのエンコーダー・パラメータの送信
機のエンコーダー・パラメータとの一致を維持するため
局所プレデイクタおよび局所エンコーダーにも供給され
る。
CMコード化システムは、基本的に32から64kbi
t/sの間隔よりなるレートについて、良好な性能を提
供するが、より低いレートでは、その性能はレートの減
少とともに強く減ずる。より低いレートにおいては、異
なるコード化技術、より特定的には、合成による分析技
術が使用される。しかし、これらの技術も、組み込み式
のコードをもたらさないし、組み込み式のコードを得る
方法を記述した文献もない。ララバロン(M.M.La
ra−Barron)およびロックハート(G.B.L
ockhart)による論文には、示唆された方法が、
現在のフレーム・サンプルをデコード化するのに過去の
情報を利用するすべての低ビット・レート・エンコーダ
ーに適用可能であつて、それゆえ、このような方法が合
成による分析のコード化技術の場合にもまた使用できる
と述べている。しかしながら、性能の表示は32kbi
t/s のADPCMコード化についてのみ与えられた
事実を無視しても、送信機および受信機の構造は、送信
機における実際のコード化回路、受信機におけるデコー
ド化回路に加えて、送信機でのデコーダーおよびプレデ
イクタ、受信機でのプレデイクタを含む典型的なDPC
M/ADPCMシステムの構成である:前記装置は、合
成による分析技術を利用するシステムの送信機/受信機
のためには用意されていない、そしてこれらのものの追
加は、前記送信機/受信機の構造を大きく複雑化するこ
とになる。これに加えて、コード化回路/デコード化回
路は、いくつかのデジタル・フィルターを含んでいるの
で、それらのメモリを正確に更新する問題が生じる。
ード化の方法および装置を提供するもので、合成による
分析技術を使用し、このようなシステムの送信機/受信
機の典型的構造を変えることなく、組み込み式のコード
化の達成を可能とするものである。
レームに変換された音声信号を、合成による分析技術に
よりコード化する方法であり、コード化フェーズとデコ
ード化フェーズを含み、コード化フェーズにおいては、
励振信号が、とり得る励振信号のセットから選択されて
合成フィルターに送られ、該励振信号に音声信号の短期
及び長期スペクトル特性が与えられて合成信号が作ら
れ、さらに、元の音声信号と該合成信号の比較及び比較
された信号の同時スペクトル整形により得られた知覚的
に有意な歪みの度合いを最小にするように、励振信号が
選択され、そして、各フレームに対してコード化された
信号が、励振に関する情報を含んで発生され、デコード
化フェーズにおいては、受信したコード化信号内に含ま
れる励振情報を用いて、コード化に用いられた励振信号
セットと同じセットから選択された励振信号が、コード
化フェーズにおいて該励振信号に作用した合成フィルタ
ーと対応する合成フィルターに送られ、さらに、コード
化信号がパケットに編成されるネットワークにおいて使
用できるように、組み込みコード化を実施する為に[該
パケットは、第1ビットレートで伝送され、第1ビット
レートより低いが所定の最小伝送レートよりは低くない
ビットレートで受信でき、種々のレートは離散的なステ
ップだけ異なる]、以下の特徴を有する。
る励振信号のセットが、複数のサブセットに分割され、
第1のサブセットは、最小伝送レートでコード化信号を
伝送するのに必要な情報量を有する夫々の励振に寄与
し、その他のサブセットは、前記離散的ステップの一つ
にそれぞれ対応する寄与をし、前記その他のサブセット
の寄与分は、所定の順に用いられ、第1のサブセット及
び先行サブセットの寄与分に加えられる。
において、第1のサブセットの励振寄与分をフィルタリ
ングするときのみ、1以上の先行フレームに関するフィ
ルタリング結果のメモリが考慮されるように、且つ、そ
の他の全てのサブセットの励振寄与分は、先行フレーム
に関するフィルタリング結果を考慮することなくフィル
タリングされるように、励振信号の全てのサブセットに
よる寄与分がフィルタリングされる。
るサブセットによる寄与分は、互いに区別できる異なる
パケット内に挿入され、第1ビットレートからより低い
レートのうちの1つへレートを落とすことは、第1レー
トに達せさせた励振寄与分を含む第1のパケットを放棄
し、さらには、前述の増加ステップに対応する励振寄与
分を含むパケットを放棄することにより達成される。
ムに対し、コード化信号がどんなビット・レートで受信
されても第1のサブセットの励振寄与分は合成フィルタ
リングされ、また、もしこの受信レートが最小レートよ
り高いならば、このようなレートに導いたステップに対
応するサブセットの励振寄与分もフィルタリングされ、
第1のサブセットの励振寄与分のフィルタリングは、メ
モリを用いたフィルタリングであり、その他のサブセッ
トの励振寄与分のフィルタリングは、メモリを用いない
フィルタリングである。
よる分析技術により音声信号をコード化及びデコード化
するための装置であり、請求項1乃至3のいずれか一項
に記載の方法を実施するためのものであり、コーダ及び
デコーダを含む。
第1の励振信号源(ROM11,M11,ROM12,
M12,ROM13,M13)であって、音声信号のサ
ンプルフレームに関するコード化操作に用いられるべき
励振信号が選択される励振信号源、 (イ)励振信号に音声信号の短期及び長期スペクトル特
性を付与し、合成信号を出力する第1のフィルタリング
・システム(F3)、 (ウ)音声信号と比較して、合成信号の歪みの知覚的に
有意な測定を行い、その歪みを最小化する最適励振信号
を探索し、且つその最適励振信号に関する情報を含むコ
ード化信号を発生するための手段(SW,SM2,EL
2,C2)、及び (エ)コード化信号の伝送をパケット・フローとして編
成するための手段(PK)を含む。
出するための手段(DPK)、 (カ)第1の励振信号源(ROM11,M11,ROM
12,M12,ROM13,M13)により与えられた
前記励振信号の組に対応する第2の励振信号の組
であって、1フレーム間のコード化に用いられた励振信
号に対応する励振信号が、コード化信号に含まれる励振
情報を基にして励振信号の組(e1,e2,e3)から
選択される第2励振信号源、及び (キ)デコード化の間に合成信号を発生する、第1のフ
ィルタリング・システム(F3)と同一の第2のフィル
タリング・システム(F4)を含む。さらに、以下の特
徴を有する。
11,ROM12,M12,ROM13,M13)が、
複数の部分源を含み、部分源の各々が、励振信号の異な
るサブセットを供給し、第1の部分源(ROM11,M
11)により供給されるサブセット(e1)は、最小ビ
ット・レートでのパケット伝送を得るのに要するビット
・ストリームのコード化信号に寄与し、その他の部分源
(ROM12,M12,ROM13,M13)により供
給されるサブセット(e2,e3)は、第1の部分源
(ROM11,M11)により供給される寄与に続いて
追加され、且つビット・レートを離散的ステップづつ最
大ビット・レートまで増加するビット・ストリームのコ
ード化信号に寄与する。
2,E13)は、第1の励振信号源の部分源により供給
されたサブセットに対応する励振信号の各サブセットを
供給する複数の部分源を含む。
テム(F3,F4)は夫々、第1フィルタリング構造
(F31,F41)、及び別のフィルタリング構造(F
32,F33;F42,F43)を含み、該第1フィル
タリング構造(F31,F41)には、第1サブセット
に属する励振信号が与えられ、1フレームに関するフィ
ルタリングの間、先行フレームに関するフィルタリング
のメモリを用いて、それらの励振信号を処理し、上記別
のフィルタリング構造(F32,F33;F42,F4
3)には夫々、励振信号のその他のサブセットのうちの
1つが与えられ、1フレームに関するフィルタリングの
間、先行フレームに関するフィルタリングのメモリを用
いることなく関連信号を処理する。
めの手段(SW,SM2,EL2)が、励振信号の全サ
ブセットからの寄与分を含んだ励振信号を、コード化信
号を発生する手段(C2)に与える。
段(PK)は、励振信号の異なるサブセットから生じる
励振情報を異なるパケット内に導入する。
からの寄与分を常に含んだ励振であって、音声信号サン
プルの1フレームに関するパケットフローが最小レート
より高いレートで受信されるときのみ、1以上の別のサ
ブセット(e2,e3)からの寄与分を含む該励振を処
理することにより、第2フィルタリング・システム(F
4)がデコード化において合成された信号を供給する。
ドブック・エキサイテッド・リニアー・プレデイクショ
ン)技術を用いるコード化システムも知られており、こ
のシステムにおいては、励振コードブックが部分コード
ブックに分割される。その一例は、ジャーソン(I.
A.Gerson)およびジャスク(M.A.Jasu
k)により1990年4月3〜6日アルバケルク(US
A)で開催された音響、音声、および信号処理に関する
国際会議(ICASSP 90)に提出された『ベクト
ル・サム・エキサイテッド・リニアー・プレデイクショ
ン(VSELP)8kbit/sにおける音声コード
化』と題する論文に記述されている。しかしながら、こ
れらのシステムは固定レートのネットワークに採用され
ているものであり、従って受信側でも励振信号は常にす
べての部分コードブックの寄与を含み、送信機および受
信機でのフィルターのチューニングの問題は存在しな
い。
およびコード化装置を用いて合成による分析技術により
コード化された信号を伝送する方法をも提供する。本発
明は、CELP技術使用の場合の発明の実施を示す添付
図面よりより明らかとなるであろう。
コード化/デコード化システムの構成を手短に説明す
る。既知のように、このようなシステムにおいては、発
声器官を模した合成フィルターに与えられる励振信号
は、例えば、適当なコードブックから選ばれた、ガウス
型ホワイトノイズのランダム列から得られたベクトルか
らなる。コード化フェーズの間、所与の音声信号サンプ
ルのブロックに対して、合成フィルターに送られて知覚
的に有意な歪み度合いを最小にするベクトルが探され
る。この知覚的に有為な歪み度合いは、合成サンプルと
原信号の対応サンプルを比較すること、及び人間の知覚
が導入された歪みをいかに評価するかをも考慮に入れた
関数による同時重み付けにより得られる。この操作は、
励振信号の性質により違いは有るものの全ての合成によ
る分析技術に基づいたシステムについて典型的なもので
ある。
システムの送信機を略述する。(i) 発声器官を模
し、励振信号に、それぞれ信号の微細なスペクトル構造
(より特定的には、声音の周期性)に依存する特性、お
よび信号のスペクトル的エンベロプに依存する特性を導
入する、長期合成フィルター(プレデイクタ)LT1お
よび短期合成フィルター(プレデイクタ)ST1を含む
フィルタリング・システム(合成フィルター)F1。こ
の長期合成フィルターの典型的伝達関数は B(z)= 1/(1−βz−L) (1) (式中、z−1は、一サンプリング間隔での遅延、βお
よびLは長期合成の利得および遅延(後者は、発声され
た音のピッチ周期またはその倍数とする)とする)。こ
の短期合成フィルターの典型的伝達関数は A(z)= 1/(1−Σαiz−i) (2) (式中、αiは、公知のリニアー・プレデイクション技
術を使い、入力信号s,(n)から決定したリニアー・
プレデイクション係数のベクトルであり、合計Σはその
ブロック中の全てのサンプルに亘ってとられる)で表さ
れる。
ドブックを含むリード・オンリー・メモリROM1。該
ベクトルは、マルチプライアMにおいてスケール・ファ
クタγで重み付けされ、F1でフィルタリングされるべ
き励振信号e(n)を形成する。予め定めた同じスケー
ル・ファクタが、最適ベクトル(即ち、コード化される
サンプルのブロックに対して歪みを最小にするベクト
ル)を求める全探索に使用することが出来、あるいは各
ベクトルのための最適スケール・ファクタが、探索中に
決定し使用できる。
済信号s1(n)との比較を実行し、前記二信号の差よ
りなるエラー信号d(n)を供給する加算器SM1。
り知覚し難くなるように、エラー信号を、スペクトル的
に整形するためのフィルターSW。典型的なSWは、 W(Z)=(1−Σαiz−i)/(1−Σαi/λiz−i) (3) の型の伝達関数を有する。(式中、λは、フォルマント
の周りのバンド増大を決定する、実験的に定まる定数補
正ファクター(典型的には、0.8から0.9のオー
ダ)を表す。)このフィルターは、SM1が直接に重み
付けエラーを与え得るように、SM1の上流の両入力に
配置することも出来る。その場合、ST1の伝達関数は
1/(1−Σαi λiz−i)となる。
演算を実行し、スケール・ファクタおよび長期フィルタ
ーパラメータを出来るだけ最適化する処理装置EL1。
は、選択された最適ベクトルのインデックスi、スケー
ル・ファクターγ、LT1の遅延L及び利得β、並びに
コーダーC1で適正に量子化されたST1の係数αiか
らなる。F1中のフィルターは、コード化されるべき各
新ブロック毎にリセットされなければならないことは明
らかである。
オンリー・メモリROM2、マルチプライアM2、及び
長期合成フィルターLT2と短期合成フィルターST2
のカスケードからなる合成フィルターF2を含む。これ
らの装置ROM2、M2、F2、LT2、ST2は、送
信器側の装置ROM1、M1、F1、LT1、ST1と
それぞれ同一のものである。デコード化されたインデッ
クスiでアドレス指定されるメモリROM2は、送信側
で使われたのと同じベクトルをF2に供給する。このベ
クトルは、まずスケール・ファクター
ータ
ータ
信号から再構成されたものである。フィルターF2の出
力信号
給される。
ト交換網)で使用する場合、エンコーダーの下流には、
情報を送信パケットに編成する装置があり、デコーダー
の上流には、受信パケットからデコード化すべき情報を
抽出する装置がある。これらの装置は、当業に熟達した
者によく知られており、またその操作は、コード化/デ
コード化操作に影響するものではない。
す。非限定的な例示として、このようなコーダーがパケ
ット交換網PSN(より特定的には、ATMネットワー
ク)に使用されているとする。該交換網では、過負荷の
場合、伝送レートを下げるために幾つかのパケットを
(それらの性質に無関係に)落とすことが可能である。
記述をより簡単に且つ明瞭にするため、通信条件によ
り、9.6、8、又は6.4kbit/sで動作可能な
音声コーダーを考える。前記レートは、合成による分析
のコーダーが一般的に使用される範囲内にある。
コードブックは、3つの部分コードブックに分割され
る。第1の部分コードブックは、最小伝送レート6.4
kbit/sのビット・ストリームを有するコード化信
号に寄与するだけの数のベクトルを含む。該ビットスト
リームは、他のパラメータ(スケール・ファクタおよび
フィルタリング・システムのパラメータ)のコード化に
より生じたビット・ストリームに追加される。第2およ
び第3の部分コードブックは、9.6 kbit/sの
伝送レートに必要とされる寄与を提供するようなサイズ
を有している。ROM11、ROM12、ROM13
は、部分コードブックを格納したメモリを示す。M1
1、M12、M13は、夫々のスケール・ファクタγ
1、γ2、γ3によりコードベクトルを重み付けし、励
振信号e1、e2、e3を与えるマルチプライアを示
す。
しており、それゆえコード化信号は、励振に関する限
り、上記の3信号により提供される寄与を含んでいる。
伝送されるべきビットの合計数を限定するために、フィ
ルタリング・システムは全ての励振に対し、同じ(即
ち、同一の重み付け係数を使用する)であることが有利
である。それゆえ図面は、マルチプレクサMXを通じて
マルチプライアM11、M12、M13の出力に接続さ
れた、単一のフィルターF3を示す。図示上の簡潔さか
ら、F3に含まれる2つのプレデイクタは示していな
い。図中、スペクトル的重み付けが、入力信号s(n)
および励振信号に別々に行われ、加算器SM2(図1の
SM1と同様のもの)が直接重み付けエラーdwを与え
る。フィルターSWは、単にs(n)の経路上に示され
ているのみである。これは、既述のように、その励振に
対する効果が、短期合成フィルターF3を適切に選択す
ることにより得られるからである。EL2は処理装置を
示し、当該技術で公知の任意の手順により、部分コード
ブック内で最適ベクトルを探索し、他のパラメータ(特
に、スケール・ファクター及び長期フィルターの利得)
を最適化するのに必要な操作を行う。C2は、図1のC
1と同様な機能を有する装置を示す。明らかに、コード
化信号は、3つの部分コードブック内で選ばれた最適ベ
クトルのインデックスi(j)(j=1,2,3)及び
それぞれの最適スケール・ファクタγ(j)を含むもの
となる。
特定のパケット交換網PSNに要求されるようにパケッ
ト化する装置PKが続いている。異なるコードブックの
励振寄与は、PKによつて、異なるネットワーク・ノー
ドで識別され得るようにラベル付けされた異なるパケッ
トに導入される。これは、パケット・ヘッダーにおける
適当なフィールドを利用することで容易に行われる。こ
のようにして、過負荷の場合、ノードは先ずe3からの
寄与を含むパケットを落とし、次いでe2からの寄与を
含むパケットを落とすことが出来る。反対に、e1から
の寄与を含むパケットは、常にネットワークを通じて送
られ、6.4kbit/sの保証された最小のデータ・
フローを形成する。
つたパケットから、コード化音声信号を抽出し、それら
を、3つの再構成励振源E11、E12、E13に接続
されているデコード化装置D2(図1のD1と類似のも
の)に送る。励振源の各々は、それぞれデコード化され
たインデックスi1,i2,i3によりアドレス指定さ
れる、各々ROM11、ROM12またはROM13と
同一のコードブックを有するリード・オンリー・メモ
リ、ならびに、それぞれデコード化済のスケール・ファ
クタ
2と類似のもの)を含むものである。音声信号が受信さ
れるレートに依存して、図1のフィルタF2と類似の合
成フィルターF4は、6.4kbit/sで受信された
場合にはE11により供給される励振信号だけ受け取
り、8kbit/sの場合にはE11およびE12から
の励振信号だけを受け取り、9.6kbit/sの場合
にはE11、E12およびE13全部の励振信号を受け
取る。この様子は、E11からの信号は直接受入れ、E
12、E13からの出力信号は、必要に応じ例えばDP
KによりイネーブルされるANDゲートA12、A13
を通じて受入れる加算器SM3により略示されている。
の構成要素に対する種々のタイミング信号、およびそれ
らを発生するための装置は示していない。一方、タイミ
ングの面は本発明によつて影響されない。
機および受信機におけるフィルターの動作は出来るだけ
一様でなければならない。本発明に従つて、少なくとも
最小速度におけるデータ・フローがネットワークにより
保証されることを考慮すると、コーダーはこのような最
小速度に対して最適化されている。これは、第1の励振
だけによるフィルターF3、F4のメモリ寄与を利用す
ることによる一フレーム内のコード化/デコード化の実
行に対応し、一方、第2および第3の励振は、メモリな
しのフィルタリングを受ける。即ち、最適化操作は、R
OM11内のベクトルの探索のために、先行フレームに
おいて行われたフィルタリングを考慮に入れて、またR
OM12、ROM13内の探索のためには、現在のフレ
ームのみを考慮に入れて行われる。その結果、受信機に
おいても、励振信号
を考慮するものとなる。
基本的構成図は、図3および4で表される。これらの、
および続く構成図のより良い理解のために、メモリつき
のデジタル・フィルターは、考慮されたものと同一の伝
達関数を有する2つのフィルターの並列的接続により略
示されていることを考慮しなければならない。第1のフ
ィルターは、ゼロ入力フィルターで、その出力は先行フ
ィルタリングのメモリの寄与を表しており、一方、第2
のフィルターは、フィルタリングすべき信号を実際に処
理するが、そのメモリのリセットにより各フレーム毎に
初期化される(簡単のため、ベクトルの長さがフレーム
の長さと一致するものとする)。更に、メモリなしのフ
ィルタリングは、線型演算であり、効果の重ね合わせが
適用される:即ち、図2において、最小レートを越える
レートでの受信の場合、
は、メモリなしで別々にフィルタリングされた同一信号
を合計することに対応する。
ステムF4が、それぞれ励振
F43に分けて表されている。サブシステムF41は、
メモリつきのフィルタリングを行い、そこでこれは、ゼ
ロ入力素子F41aおよび励振
ものとして表されている。素子F41aおよびF41b
の出力は加算器SM31で組み合わせられ、その出力u
1は、6.4kbit/s伝送の場合に再構成デジタル
音声信号を搬送する。サブシステムF42、F43は、
メモリなしで
ある。フィルターF42の出力信号は、加算器SM32
でu1の信号と組み合わせられるが、SM32の出力u
2は、8kbit/sで受信された場合、再構成デジタ
ル音声信号を搬送する。最後に、フィルターF43の出
力信号は、9.6kbit/s伝送の場合、再構成デジ
タル音声信号を搬送する出力u3を生じる加算器SM3
3でu2の信号と組み合わせられる。
31(F31a、F31b)、F32、F33はF3を
構成するサブシステムであり、SM21、SM22、S
M23、SM24は、図2の信号dwを発生する加算器
が連鎖されたものである。より特定的には、F31aの
出力信号、即ち励振e1のフィルタリングのメモリの寄
与は、SM21における重み付け入力信号sw(n)か
ら差し引かれ、第1の部分エラーdw1を生じる。F3
1bの出力信号、即ちe1のメモリなしのフィルタリン
グの結果は、SM22におけるdw1から差し引かれ、
第2の部分エラーdw2を生じる。e2のメモリなしの
フィルタリングによる寄与は、SM23におけるdw2
から差し引かれ、信号dw3を生じ、これからe3のメ
モリなしのフィルタリングによる寄与は、SM24にお
いて差し引かれる。続く構成図のより良き理解のため
に、長期および短期プレデイクタLT31a、ST31
aおよびLT31b、ST31bのカスケードが、F3
1a、F31bに、明記されている。種々の素子中の全
てのプレデイクタは、場合により式(1)または(2)
により与えられる伝達関数を有している。
の構成を示すもので、フレームの長さが励振コードブッ
ク中のベクトルの長さが一致するものであり、且つ長期
プレデイクタの遅延Lがベクトルの長さより大きいとい
う仮定をおいている。遅延に対するこのような選択は、
CELPコーダーにおいて通常のものである。対応する
装置は、図4および図5と同一の参照記号で示される。
T311、ST312、及びマルチプライアM3を単に
含む。該マルチプライアM3は、ST312と直列に接
続され、式(1)に示されたファクターβによる乗算を
行う。フィルターST311は、ゼロ入力フィルターで
ある。ST312には、フレームのn番目のサンプルの
処理のため、長期合成フィルターLT3’の出力信号で
且つLサンプリング時間先行した信号PIT(n−L)
が送られる。長期合成フィルターLT3’は、e1(図
2)のサンプルを受け取り、短期合成フィルターST
3’と共に、仮想の合成器SIN3を形成し、素子F3
1aのためのメモリを作る。
31aのカスケードと同じ機能を有している。実際、瞬
間nにおいて、LT31a(ゼロ入力)のようなフィル
ターは、ファクターβで重み付けされた瞬間n−Lに関
するフィルタリング済信号をST31aに供給すること
になる。これと同一の信号が、遅延素子DL1において
LT3’の出力信号をLサンプリング時間だけ遅延させ
ることにより、得られる。その結果、LT31aは除去
できる。上述のように、ST31aは、ゼロ入力でメモ
リ付のフィルターST311、及びPIT(n−L)入
力でメモリなしフィルターST312に分けることが出
来る。ST311のためのメモリは、ST3’の出力信
号ZER(n)よりなる。ST311の出力信号は、加
算器SM211に送られ、信号sw(n)から減算され
る。ST312とM3のカスケードの出力信号は、SM
212に送られ、SM211の出力信号から減算され
る。これら2つの加算器は、図5の加算器SM21の機
能を遂行する。
ィルターST31bのみを含む。実際、遅延Lについて
の仮説によると、長期合成フィルターLT31bは、入
力信号を不変のまま通すことになる。これは、入力サン
プルの処理に使われるべき出力サンプルは、先行フレー
ムに関連するものだからである。同様の理由で、図4の
フィルターF32、F33は、短期合成フィルターのみ
を含み、それらをST32、ST33で示す。
の長さが、コードブックのベクトルの長さと一致すると
言う仮定に基づいている。しかしながら、通常フレーム
は20ms(8kHzのサンプリング周波数で、音声信
号が160サンプル)のオーダーの持続期間を有してお
り、このような長さのベクトルの使用が、非常に大きな
メモリを要求し、且つエラーを最小化するのに高度の計
算の複雑さをもたらすものである。一般に、より短いベ
クトル(例えば、フレームの持続期間の1/4の長さの
ベクトル)を使用して、コード化のために各サブフレー
ムあたり一励振ベクトルが使用されるように、フレーム
をコードブックのベクトルと同じ長さのサブフレームに
分割することが好まれる。
分コードブックにおける最適のベクトルの探索は、サブ
フレームの数と同じ回数繰り返される。あるATMネッ
トワークにおいては、伝送レート限定のためのパケット
落としが、一フレームから次のフレームに移行するとき
に起こるが、そのフレーム内ではレートは不変である。
そうして、一フレーム内では、コーダーのレートを、そ
のフレーム、即ち、フィルターF32、F33のメモリ
を考慮して実際に使用されているレートに、最適化する
ことが可能となる。長期予測の遅延は、それでもベクト
ルの持続期間より大きくなる。これらの条件の下で、フ
ィルターF32、F33もまた、図5でF31として示
した構造を有するものとなる。ただ、F31のメモリの
みを考慮するので、各フレームの終わりに、e2,e3
に関連する信号PITおよびZERをリセットすべき
ことだけが違うだけである。
上記構造は単純化できる。この場合、実際に、上記励振
の各々に関連する仮想的合成器は、短期合成フィルター
のみを含むものとなり、信号PITを受け取るブランチ
はなくなる。図6に示すように、これらの条件の下で
は、フィルタリング・サブシステムF32、F33は、
それぞれST311、ST31bおよびST3’(図
5)と類似の3つのフィルター群ST32a、ST32
b、ST32’およびST33a、ST33b、ST3
3’、ならびに、それぞれ加算器SM23およびSM2
4を構成する加算器群SM231、SM232、SM2
41、SM242を含んでいる。ZER2、ZER3
は、ZER(図5)、つまり、フィルターF32、F3
3におけるフィルタリングに対するメモリの寄与を表す
信号、に対応する信号を示す。最後に、RSMは、ST
32’、ST33’のメモリに対するリセット信号を示
し、コード化システムの動作のタイミングをとる従来装
置により各新フレームの始めに発生される。
れたもので、その変更および改良は本発明の範囲から逸
脱することなくなし得ることは明らかである。より特定
的には、CELPコード化スキームに言及したが、本発
明は、それ自体が励振信号の性質と無関係であるので、
すべての合成による分析コード化システムに応用でき
る。より特定的には、CELPコード化が最も広く使わ
れているマルチパルス・コード化の場合、最初のパルス
の数は、6.4kbit/sの伝送レートで使われ、他
の2つのパルスのセットは、他のもくろまれたスピード
を達成するのに必要なレート増大を提供することにな
る。
図である。
図である。
能的略図である。
号 E11、E12、E13 第2の励振信号源 EL1、EL2 処理装置 e1,e2,e3、
ー・メモリ RSM リセット信号 SIN3 仮想の合成器 SM1〜SM242 加算器 s(n) 入力信号 s1 (n) フィルタリング済信号 ST1〜ST33b,ST311,ST312 短期
合成フィルター SW、SW1 フィルター αi、
Claims (7)
- 【請求項1】 デジタルサンプルからなるフレームに変
換された音声信号を、合成による分析技術によりコード
化する方法であって、 コード化フェーズとデコード化フェーズを含み、 コード化フェーズにおいては、励振信号が、とり得る励
振信号のセットから選択されて合成フィルターに送ら
れ、該励振信号に音声信号の短期及び長期スペクトル特
性が与えられて合成信号が作られ、さらに、元の音声信
号と該合成信号の比較及び比較された信号の同時スペク
トル整形により得られた知覚的に有意な歪みの度合いを
最小にするように、励振信号が選択され、そして、各フ
レームに対してコード化された信号が、励振に関する情
報を含んで発生され、 デコード化フェーズにおいては、受信したコード化信号
内に含まれる励振情報を用いて、コード化に用いられた
励振信号セットと同じセットから選択された励振信号
が、コード化フェーズにおいて該励振信号に作用した合
成フィルターと対応する合成フィルターに送られ、さら
に、 コード化信号がパケットに編成されるネットワークにお
いて使用できるように、組み込みコード化を実施する為
に[該パケットは、第1ビットレートで伝送され、第1
ビットレートより低いが所定の最小伝送レートよりは低
くないビットレートで受信でき、種々のレートは離散的
なステップだけ異なる]、 (ア)コード化及びデコード化に用いられる励振信号の
セットが、複数のサブセットに分割され、 第1のサブセットは、最小伝送レートでコード化信号を
伝送するのに必要な情報量を有する夫々の励振に寄与
し、 その他のサブセットは、前記離散的ステップの一つにそ
れぞれ対応する寄与をし、前記その他のサブセットの寄
与分は、所定の順に用いられ、第1のサブセット及び先
行サブセットの寄与分に加えられ、 (イ)コード化フェーズの間、各フレームにおいて、第
1のサブセットの励振寄与分をフィルタリングするとき
のみ、1以上の先行フレームに関するフィルタリング結
果のメモリが考慮されるように、且つ、その他の全ての
サブセットの励振寄与分は、先行フレームに関するフィ
ルタリング結果を考慮することなくフィルタリングされ
るように、励振信号の全てのサブセットによる寄与分が
フィルタリングされ、 (ウ)さらにコード化フェーズの間、異なるサブセット
による寄与分は、互いに区別できる異なるパケット内に
挿入され、 第1ビットレートからより低いレートのうちの1つへレ
ートを落とすことは、第1レートに達せさせた励振寄与
分を含む第1のパケットを放棄し、さらには、前述の増
加ステップに対応する励振寄与分を含むパケットを放棄
することにより達成され、 (エ)デコード化フェーズの間、各フレームに対し、コ
ード化信号がどんなビット・レートで受信されても第1
のサブセットの励振寄与分は合成フィルタリングされ、
また、もしこの受信レートが最小レートより高いなら
ば、このようなレートに導いたステップに対応するサブ
セットの励振寄与分もフィルタリングされ、 第1のサブセットの励振寄与分のフィルタリングは、メ
モリを用いたフィルタリングであり、その他のサブセッ
トの励振寄与分のフィルタリングは、メモリを用いない
フィルタリングであることを特徴とする方法。 - 【請求項2】 フレームにおけるコード化に用いられる
べき励振信号が、各サブセットの複数の励振信号からな
り、 コード化及びデコード化の間、全てのサブセットの励振
信号のフィルタリングにおいて、同一フレームに関する
信号についての先行フィルタリングのメモリが考慮され
ることを特徴とする請求項1に記載の方法。 - 【請求項3】 第1のサブセットの励振寄与分に対して
のみ、合成フィルタリングにより、励振信号に長期特性
が導入されることを特徴とする請求項1または2に記載
の方法。 - 【請求項4】 合成による分析技術により音声信号をコ
ード化及びデコード化するための装置であって、 請求項1乃至3のいずれか一項に記載の方法を実施する
ためのものであり、コーダ及びデコーダを含み、該コー
ダは、 (ア)一組の励振信号(e1,e2,e3)を供給する
第1の励振信号源(ROM11,M11,ROM12,
M12,ROM13,M13)であって、音声信号のサ
ンプルフレームに関するコード化操作に用いられるべき
励振信号が選択される励振信号源、 (イ)励振信号に音声信号の短期及び長期スペクトル特
性を付与し、合成信号を出力する第1のフィルタリング
・システム(F3)、 (ウ)音声信号と比較して、合成信号の歪みの知覚的に
有意な測定を行い、その歪みを最小化する最適励振信号
を探索し、且つその最適励振信号に関する情報を含むコ
ード化信号を発生するための手段(SW,SM2,EL
2,C2)、及び (エ)コード化信号の伝送をパケット・フローとして編
成するための手段(PK)を含み、上記デコーダは、 (オ)受信したパケット・フローからコード化信号を抽
出するための手段(DPK)、 (カ)第1の励振信号源(ROM11,M11,ROM
12,M12,ROM13,M13)により与えられた
前記励振信号の組に対応する第2の励振信号の組 【外1】 を与える第2の励振信号源(E11,E12,E13)
であって、1フレーム間のコード化に用いられた励振信
号に対応する励振信号が、コード化信号に含まれる励振
情報を基にして励振信号の組(e1,e2,e3)から
選択される第2励振信号源、及び (キ)デコード化の間に合成信号を発生する、第1のフ
ィルタリング・システム (F3)と同一の第2のフィルタリング・システム(F
4)を含み、さらに (あ)第1の励振信号源(ROM11,M11,ROM
12,M12,ROM13,M13)が、複数の部分源
を含み、部分源の各々が、励振信号の異なるサブセット
を供給し、 第1の部分源(ROM11,M11)により供給される
サブセット(e1)は、最小ビット・レートでのパケッ
ト伝送を得るのに要するビット・ストリームのコード化
信号に寄与し、 その他の部分源(ROM12,M12,ROM13,M
13)により供給されるサブセット(e2,e3)は、
第1の部分源(ROM11,M11)により供給される
寄与に続いて追加され、且つビット・レートを離散的ス
テップづつ最大ビット・レートまで増加するビット・ス
トリームのコード化信号に寄与し、 (い)第2の励振信号源(E11,E12,E13)
は、第1の励振信号源の部分源により供給されたサブセ
ットに対応する励振信号の各サブセットを供給する複数
の部分源を含み、 (う)第1及び第2フィルタリング・システム(F3,
F4)は夫々、第1フィルタリング構造(F31,F4
1)、及び別のフィルタリング構造(F32,F33;
F42,F43)を含み、該第1フィルタリング構造
(F31,F41)には、第1サブセットに属する励振
信号 【外2】 が与えられ、1フレームに関するフィルタリングの間、
先行フレームに関するフィルタリングのメモリを用い
て、それらの励振信号を処理し、 上記別のフィルタリング構造(F32,F33;F4
2,F43)には夫々、励振信号のその他のサブセット
のうちの1つが与えられ、1フレームに関するフィルタ
リングの間、先行フレームに関するフィルタリングのメ
モリを用いることなく関連信号を処理し、 (え)歪みを測定し最適励振を探索するための手段(S
W,SM2,EL2)が、励振信号の全サブセットから
の寄与分を含んだ励振信号を、コード化信号を発生する
手段(C2)に与え、 (お)伝送をパケットに編成するための手段(PK)
は、励振信号の異なるサブセットから生じる励振情報を
異なるパケット内に導入し、そして、 (か)励振信号の第1サブセット 【外3】 からの寄与分を常に含んだ励振であって、音声信号サン
プルの1フレームに関するパケットフローが最小レート
より高いレートで受信されるときのみ、1以上の別のサ
ブセット 【外4】 からの寄与分を含む該励振を処理することにより、第2
フィルタリング・システム(F4)がデコード化におい
て合成された信号を供給することを特徴とする装置。 - 【請求項5】 励振信号の各サブセットが、複数の励振
信号を有するフレームに関するコード化信号に寄与し、
前記別のフィルタリング構造(F32、F33;F4
2、F43)が、同一フレームに関する先行サンプルの
ブロックに対して行われたフィルタリングの結果を格納
するためのメモリ要素を含み、そのメモリ要素が、新し
いフレームに関するフィルタリング操作の開始時にリセ
ットされることを特徴とする請求項4に記載の装置。 - 【請求項6】 コーダーおよびデコーダーにおける第1
のフィルタリング構造(F31、F41)が、短期合成
フィルターおよび長期合成フィルターのカスケードを含
み、上記別のフィルタリング構造(F32、F33;F
42、F43)が、短期合成フィルターからなることを
特徴とする請求項4または5に記載の装置。 - 【請求項7】 パケット化されたコード化音声信号をネ
ットワーク内で伝送する方法であって、 該ネットワークにおいては、パケットは第1ビットレー
トで送信され、第1ビットレートより低いが保証最小速
度よりは低くないビットレートで受信でき、 音声信号は、合成による分析技術によりコード化され、 とり得る励振信号のセット内で選択された励振信号が、
フィルタリング・システム(F3,F4)で処理され、
該フィルタリング・システム(F3,F4)は、励振信
号に音声信号の長期及び短期特性を挿入し、 (ア)送信側でコード化するため選択された励振信号
が、複数の励振信号ブランチ(ROM11,M11,R
OM12,M12,ROM13,M13)により与えら
れた寄与分を含み、 第1の励振信号ブランチ(ROM11,M11)は、最
小レートでの伝送を可能にする寄与分を与え、 その他のブランチ(ROM12,M12,ROM13,
M13)の各々は、伝送レートを一連の所定ステップづ
つ最小レートから第1レートまで増加するのに必要な寄
与分を与え、 (イ)音声信号のデジタルサンプルからなる1フレーム
に関するコード化操作の間、第1ブランチ(ROM1
1,M11)により与えられる励振信号は、先行フレー
ムに関するコード化操作の間に行われたフィルタリング
結果を考慮してフィルタリングされ、他のブランチ(R
OM12,M12,ROM13,M13)により与えら
れる励振信号は、このような結果を考慮せずにフィルタ
リングされ、 (ウ)異なるブランチにより与えられる寄与分は、異な
るパケットに挿入され、該パケットは、互いに区別され
得るようにラベル付けされており、 (エ)ネットワークに沿い、可能なパケット抑制が、第
1ブランチとは異なるブランチにより与えられる励振寄
与分を含んだパケットに対してのみ行われ、 初めは、伝送レートを第1の値に導くステップに対応す
る励振寄与分を含んだパケットを抑制し、 次に、前述の増加ステップに対応した励振寄与分を含ん
だパケットを抑制し、 (オ)受信側でデコード化するためフィルタリングする
べき励振信号は、送信側の第1励振信号ブランチに対応
する第1ブランチにより与えられる寄与分を常に含み、 もし1フレーム内のパケットが最小レートより高いレー
トで受信されるならば、励振信号は、そのようなレート
をもたらす増加ステップに対応する励振信号ブランチの
寄与分も含み、さらに、 (カ)デコード化されるべき音声信号のデジタルサンプ
ルからなるフレームに関する信号のデコード化の間、異
なる励振信号ブランチの寄与分のフィルタリングが、第
1励振信号ブランチに対しては、先行フレームに関する
信号のフィルタリング結果を考慮することにより行わ
れ、その他の励振信号ブランチに対しては、そのような
結果を考慮することなく行われることを特徴とする方
法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT68029-A/90 | 1990-12-20 | ||
IT68029A IT1241358B (it) | 1990-12-20 | 1990-12-20 | Sistema di codifica del segnale vocale con sottocodice annidato |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0728495A JPH0728495A (ja) | 1995-01-31 |
JP2832871B2 true JP2832871B2 (ja) | 1998-12-09 |
Family
ID=11307315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3350519A Expired - Lifetime JP2832871B2 (ja) | 1990-12-20 | 1991-12-11 | 音声信号の組み込み式コード化システム |
Country Status (9)
Country | Link |
---|---|
US (2) | US5353373A (ja) |
EP (1) | EP0492459B1 (ja) |
JP (1) | JP2832871B2 (ja) |
AT (1) | ATE153470T1 (ja) |
CA (1) | CA2057384C (ja) |
DE (2) | DE69126195T2 (ja) |
ES (1) | ES2038106T3 (ja) |
GR (2) | GR930300034T1 (ja) |
IT (1) | IT1241358B (ja) |
Families Citing this family (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IT1241358B (it) * | 1990-12-20 | 1994-01-10 | Sip | Sistema di codifica del segnale vocale con sottocodice annidato |
IT1257065B (it) * | 1992-07-31 | 1996-01-05 | Sip | Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi. |
FR2700632B1 (fr) * | 1993-01-21 | 1995-03-24 | France Telecom | Système de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués. |
SG43128A1 (en) * | 1993-06-10 | 1997-10-17 | Oki Electric Ind Co Ltd | Code excitation linear predictive (celp) encoder and decoder |
US5621852A (en) | 1993-12-14 | 1997-04-15 | Interdigital Technology Corporation | Efficient codebook structure for code excited linear prediction coding |
US5574825A (en) * | 1994-03-14 | 1996-11-12 | Lucent Technologies Inc. | Linear prediction coefficient generation during frame erasure or packet loss |
US5615298A (en) * | 1994-03-14 | 1997-03-25 | Lucent Technologies Inc. | Excitation signal synthesis during frame erasure or packet loss |
US5699478A (en) * | 1995-03-10 | 1997-12-16 | Lucent Technologies Inc. | Frame erasure compensation technique |
US5508708A (en) * | 1995-05-08 | 1996-04-16 | Motorola, Inc. | Method and apparatus for location finding in a CDMA system |
US5668925A (en) * | 1995-06-01 | 1997-09-16 | Martin Marietta Corporation | Low data rate speech encoder with mixed excitation |
US5649051A (en) * | 1995-06-01 | 1997-07-15 | Rothweiler; Joseph Harvey | Constant data rate speech encoder for limited bandwidth path |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
JP2861889B2 (ja) * | 1995-10-18 | 1999-02-24 | 日本電気株式会社 | 音声パケット伝送システム |
IT1281001B1 (it) * | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
US6240384B1 (en) | 1995-12-04 | 2001-05-29 | Kabushiki Kaisha Toshiba | Speech synthesis method |
US6765904B1 (en) | 1999-08-10 | 2004-07-20 | Texas Instruments Incorporated | Packet networks |
SE9601606D0 (sv) | 1996-04-26 | 1996-04-26 | Ericsson Telefon Ab L M | Sätt vid radiotelekommunikationssystem |
EP0895672B1 (en) * | 1997-02-10 | 2006-11-22 | Koninklijke Philips Electronics N.V. | Communication network for transmitting speech signals |
JP3134817B2 (ja) * | 1997-07-11 | 2001-02-13 | 日本電気株式会社 | 音声符号化復号装置 |
US6182030B1 (en) | 1998-12-18 | 2001-01-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Enhanced coding to improve coded communication signals |
US6801499B1 (en) * | 1999-08-10 | 2004-10-05 | Texas Instruments Incorporated | Diversity schemes for packet communications |
US6757256B1 (en) | 1999-08-10 | 2004-06-29 | Texas Instruments Incorporated | Process of sending packets of real-time information |
US6801532B1 (en) * | 1999-08-10 | 2004-10-05 | Texas Instruments Incorporated | Packet reconstruction processes for packet communications |
US6804244B1 (en) | 1999-08-10 | 2004-10-12 | Texas Instruments Incorporated | Integrated circuits for packet communications |
US6744757B1 (en) | 1999-08-10 | 2004-06-01 | Texas Instruments Incorporated | Private branch exchange systems for packet communications |
US6678267B1 (en) | 1999-08-10 | 2004-01-13 | Texas Instruments Incorporated | Wireless telephone with excitation reconstruction of lost packet |
WO2001041124A2 (en) * | 1999-12-01 | 2001-06-07 | Koninklijke Philips Electronics N.V. | Method of and system for coding and decoding sound signals |
US7574351B2 (en) * | 1999-12-14 | 2009-08-11 | Texas Instruments Incorporated | Arranging CELP information of one frame in a second packet |
EP1199812A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Perceptually improved encoding of acoustic signals |
US7339605B2 (en) | 2004-04-16 | 2008-03-04 | Polycom, Inc. | Conference link between a speakerphone and a video conference unit |
US8948059B2 (en) | 2000-12-26 | 2015-02-03 | Polycom, Inc. | Conference endpoint controlling audio volume of a remote device |
US7864938B2 (en) | 2000-12-26 | 2011-01-04 | Polycom, Inc. | Speakerphone transmitting URL information to a remote device |
US8977683B2 (en) * | 2000-12-26 | 2015-03-10 | Polycom, Inc. | Speakerphone transmitting password information to a remote device |
US8964604B2 (en) | 2000-12-26 | 2015-02-24 | Polycom, Inc. | Conference endpoint instructing conference bridge to dial phone number |
US9001702B2 (en) | 2000-12-26 | 2015-04-07 | Polycom, Inc. | Speakerphone using a secure audio connection to initiate a second secure connection |
US8934382B2 (en) | 2001-05-10 | 2015-01-13 | Polycom, Inc. | Conference endpoint controlling functions of a remote device |
US8976712B2 (en) | 2001-05-10 | 2015-03-10 | Polycom, Inc. | Speakerphone and conference bridge which request and perform polling operations |
AU2002258135A1 (en) | 2001-05-10 | 2002-11-18 | Polycom Israel Ltd. | Control unit for multipoint multimedia/audio system |
JP3666430B2 (ja) * | 2001-09-04 | 2005-06-29 | ソニー株式会社 | 情報送信装置及び情報送信方法、並びに情報受信装置及び情報受信方法 |
US7978838B2 (en) | 2001-12-31 | 2011-07-12 | Polycom, Inc. | Conference endpoint instructing conference bridge to mute participants |
US8947487B2 (en) | 2001-12-31 | 2015-02-03 | Polycom, Inc. | Method and apparatus for combining speakerphone and video conference unit operations |
US8885523B2 (en) | 2001-12-31 | 2014-11-11 | Polycom, Inc. | Speakerphone transmitting control information embedded in audio information through a conference bridge |
US8102984B2 (en) * | 2001-12-31 | 2012-01-24 | Polycom Inc. | Speakerphone and conference bridge which receive and provide participant monitoring information |
US8934381B2 (en) * | 2001-12-31 | 2015-01-13 | Polycom, Inc. | Conference endpoint instructing a remote device to establish a new connection |
US8144854B2 (en) * | 2001-12-31 | 2012-03-27 | Polycom Inc. | Conference bridge which detects control information embedded in audio information to prioritize operations |
US8223942B2 (en) * | 2001-12-31 | 2012-07-17 | Polycom, Inc. | Conference endpoint requesting and receiving billing information from a conference bridge |
US7787605B2 (en) | 2001-12-31 | 2010-08-31 | Polycom, Inc. | Conference bridge which decodes and responds to control information embedded in audio information |
US8705719B2 (en) | 2001-12-31 | 2014-04-22 | Polycom, Inc. | Speakerphone and conference bridge which receive and provide participant monitoring information |
US7742588B2 (en) * | 2001-12-31 | 2010-06-22 | Polycom, Inc. | Speakerphone establishing and using a second connection of graphics information |
CA2392640A1 (en) * | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
US7047188B2 (en) * | 2002-11-08 | 2006-05-16 | Motorola, Inc. | Method and apparatus for improvement coding of the subframe gain in a speech coding system |
JP4744438B2 (ja) * | 2004-03-05 | 2011-08-10 | パナソニック株式会社 | エラー隠蔽装置およびエラー隠蔽方法 |
JP4771674B2 (ja) * | 2004-09-02 | 2011-09-14 | パナソニック株式会社 | 音声符号化装置、音声復号化装置及びこれらの方法 |
US7796565B2 (en) * | 2005-06-08 | 2010-09-14 | Polycom, Inc. | Mixed voice and spread spectrum data signaling with multiplexing multiple users with CDMA |
US8126029B2 (en) * | 2005-06-08 | 2012-02-28 | Polycom, Inc. | Voice interference correction for mixed voice and spread spectrum data signaling |
US8199791B2 (en) * | 2005-06-08 | 2012-06-12 | Polycom, Inc. | Mixed voice and spread spectrum data signaling with enhanced concealment of data |
JPWO2007043643A1 (ja) * | 2005-10-14 | 2009-04-16 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化方法、及び音声復号化方法 |
CN101000768B (zh) * | 2006-06-21 | 2010-12-08 | 北京工业大学 | 嵌入式语音编解码的方法及编解码器 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4790016A (en) * | 1985-11-14 | 1988-12-06 | Gte Laboratories Incorporated | Adaptive method and apparatus for coding speech |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
US4852179A (en) * | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
JPH01233499A (ja) * | 1988-03-14 | 1989-09-19 | Nec Corp | 音声信号符号化復号化方法及びその装置 |
IL94119A (en) * | 1989-06-23 | 1996-06-18 | Motorola Inc | Digital voice recorder |
IL95753A (en) * | 1989-10-17 | 1994-11-11 | Motorola Inc | Digits a digital speech |
IT1241358B (it) * | 1990-12-20 | 1994-01-10 | Sip | Sistema di codifica del segnale vocale con sottocodice annidato |
US5185796A (en) * | 1991-05-30 | 1993-02-09 | Motorola, Inc. | Encryption synchronization combined with encryption key identification |
-
1990
- 1990-12-20 IT IT68029A patent/IT1241358B/it active IP Right Grant
-
1991
- 1991-12-04 US US07/803,484 patent/US5353373A/en not_active Expired - Lifetime
- 1991-12-11 JP JP3350519A patent/JP2832871B2/ja not_active Expired - Lifetime
- 1991-12-11 CA CA002057384A patent/CA2057384C/en not_active Expired - Lifetime
- 1991-12-19 ES ES91121836T patent/ES2038106T3/es not_active Expired - Lifetime
- 1991-12-19 DE DE69126195T patent/DE69126195T2/de not_active Expired - Lifetime
- 1991-12-19 DE DE199191121836T patent/DE492459T1/de active Pending
- 1991-12-19 AT AT91121836T patent/ATE153470T1/de not_active IP Right Cessation
- 1991-12-19 EP EP91121836A patent/EP0492459B1/en not_active Expired - Lifetime
-
1993
- 1993-06-07 GR GR930300034T patent/GR930300034T1/el unknown
-
1994
- 1994-02-16 US US08/197,129 patent/US5469527A/en not_active Expired - Lifetime
-
1997
- 1997-08-19 GR GR970402114T patent/GR3024475T3/el unknown
Also Published As
Publication number | Publication date |
---|---|
EP0492459A2 (en) | 1992-07-01 |
US5469527A (en) | 1995-11-21 |
IT1241358B (it) | 1994-01-10 |
EP0492459A3 (en) | 1993-02-03 |
ATE153470T1 (de) | 1997-06-15 |
US5353373A (en) | 1994-10-04 |
EP0492459B1 (en) | 1997-05-21 |
CA2057384C (en) | 1996-09-17 |
IT9068029A1 (it) | 1992-06-21 |
DE69126195T2 (de) | 1997-11-06 |
DE492459T1 (de) | 1993-06-09 |
IT9068029A0 (it) | 1990-12-20 |
CA2057384A1 (en) | 1992-06-21 |
ES2038106T3 (es) | 1997-07-01 |
GR3024475T3 (en) | 1997-11-28 |
DE69126195D1 (de) | 1997-06-26 |
ES2038106T1 (es) | 1993-07-16 |
GR930300034T1 (en) | 1993-06-07 |
JPH0728495A (ja) | 1995-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2832871B2 (ja) | 音声信号の組み込み式コード化システム | |
JP4005359B2 (ja) | 音声符号化及び音声復号化装置 | |
CA1181854A (en) | Digital speech coder | |
EP0707308B1 (en) | Frame erasure or packet loss compensation method | |
JP4550289B2 (ja) | Celp符号変換 | |
US20040204935A1 (en) | Adaptive voice playout in VOP | |
JPH05197400A (ja) | 低ビット・レート・ボコーダ手段および方法 | |
JPH10187197A (ja) | 音声符号化方法及び該方法を実施する装置 | |
JPH10187196A (ja) | 低ビットレートピッチ遅れコーダ | |
US5295224A (en) | Linear prediction speech coding with high-frequency preemphasis | |
US6826527B1 (en) | Concealment of frame erasures and method | |
MXPA01003150A (es) | Procedimiento de cuantificacion de los parametros de un codificador de palabras. | |
US7302385B2 (en) | Speech restoration system and method for concealing packet losses | |
JP3396480B2 (ja) | 多重モード音声コーダのためのエラー保護 | |
JPH11259100A (ja) | 励起ベクトルの符号化方法 | |
US6611797B1 (en) | Speech coding/decoding method and apparatus | |
EP1103953A2 (en) | Method for concealing erased speech frames | |
JPH0934499A (ja) | 音声符号化通信方式 | |
EP0361432B1 (en) | Method of and device for speech signal coding and decoding by means of a multipulse excitation | |
JP3050978B2 (ja) | 音声符号化方法 | |
JPH0720897A (ja) | ディジタルコーダにおけるスペクトルパラメータを量子化する方法および装置 | |
JP3232701B2 (ja) | 音声符号化方法 | |
RU2792658C1 (ru) | Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио | |
Drygajilo | Speech Coding Techniques and Standards | |
JP3071800B2 (ja) | 適応ポストフィルタ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081002 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091002 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091002 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101002 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101002 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111002 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121002 Year of fee payment: 14 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121002 Year of fee payment: 14 |