JPH06507252A - 音声の量子化とエラー訂正のための方法 - Google Patents
音声の量子化とエラー訂正のための方法Info
- Publication number
- JPH06507252A JPH06507252A JP4502957A JP50295792A JPH06507252A JP H06507252 A JPH06507252 A JP H06507252A JP 4502957 A JP4502957 A JP 4502957A JP 50295792 A JP50295792 A JP 50295792A JP H06507252 A JPH06507252 A JP H06507252A
- Authority
- JP
- Japan
- Prior art keywords
- segment
- vector
- amplitude
- svector
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 121
- 238000012937 correction Methods 0.000 title claims description 46
- 238000013139 quantization Methods 0.000 title claims description 40
- 239000013598 vector Substances 0.000 claims description 83
- 230000003595 spectral effect Effects 0.000 claims description 70
- 230000005284 excitation Effects 0.000 claims description 18
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 7
- 238000009499 grossing Methods 0.000 claims description 6
- 238000003786 synthesis reaction Methods 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 230000005236 sound signal Effects 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims 1
- 238000001514 detection method Methods 0.000 description 14
- 238000001228 spectrum Methods 0.000 description 11
- 230000015556 catabolic process Effects 0.000 description 6
- 238000006731 degradation reaction Methods 0.000 description 6
- 240000007471 Garcinia livingstonei Species 0.000 description 5
- 235000018084 Garcinia livingstonei Nutrition 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 244000005894 Albizia lebbeck Species 0.000 description 1
- 244000144730 Amygdalus persica Species 0.000 description 1
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- BLRPTPMANUNPDV-UHFFFAOYSA-N Silane Chemical compound [SiH4] BLRPTPMANUNPDV-UHFFFAOYSA-N 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 239000009438 liyan Substances 0.000 description 1
- -1 multiband excitation Chemical compound 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 229910000077 silane Inorganic materials 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/087—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
- H03M13/35—Unequal or adaptive error protection, e.g. by providing a different level of protection according to significance of source information or by adapting the coding according to the change of transmission channel characteristics
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Error Detection And Correction (AREA)
Abstract
Description
Claims (33)
- 1.音声が複数セグメントに分割され各セグメントについてスベクトルガー組の 周波数で標本化されて一組のスベクトル振幅を形成し、該スベクトルは一のセグ メントと次のセグメントで一般に異なった周波数で標本化され、現在のセグメン トのスベクトル振幅を予測するために少なくとも一の前のセグメントが用いられ 、現在のセグメントの実際のスベクトル振幅と現在のセグメントの予測スベクト ル振幅の間の差に基づく予測残差が引き続く符号化に用いられる、音声符号化の 方法において、現在の予測スベクトル振幅が、少なくとも一部、前のセグメント のスベクトル振幅の補間に基づき、現在のセグメントの周波数で前のセグメント のスベクトル振幅を推定することを特徴とする音声符号化方法。
- 2.音声が複数セグメントに分割され各セグメントについてスベクトルが一組の 周波数で標本化されて一組のスベクトル振幅を形成し、該スベクトルは一のセグ メントと次のセグメントで一般に異なった周波数で標本化され、現在のセグメン トのスベクトル振幅を予測するために少なくとも一の前のセグメントが用いられ 、現在のセグメントの実際のスベクトル振幅と現在のセグメントの予測スベクト ル振幅の間の差に基づく予測残差が引き続く符号化に用いられる、音声符号化の 方法において、予測残差ガ予め定められた偶数のブロックに分割され、該ブロッ クの偶数は特定のブロックの残差の数に依存せず、ブロックが符号化されること を特徴とする音声符号化方法。
- 3.現在のセグメントの予測されるスベクトル振幅が、少なくとも一部、前のセ グメントのスベクトル振幅を補間することに基づき、現在のセグメントの周波数 で前のセグメントのスベクトル振幅を推定する請求の範囲第2項に記載の方法。
- 4.音声が複数セグメントに分割され各セグメントについてスベクトルが一組の 周波数で標本化されて一組のスベクトル振幅を形成し、該スベクトルは一のセグ メントと次のセグメントで一般に異なった周波数で標本化され、現在のセグメン トのスベクトル振幅を予測するために少なくとも一の前のセグメントが用いられ 、現在のセグメントの実際のスベクトル振幅と現在のセグメントの予測スベクト ル振幅の間の基に基づく予測残差が引き続く符号化に用いられる音声符号化の方 法において、予測残差が複数ブロックにグループ化され、各ブロック内の予測残 差の平均が決定され、すべてのブロックの平均が予測残差ブロック平均(PRB A)ベクトルにグループ化され、PRBAベクトルが量子化されることを特徴と する音声符号化方法。
- 5.予め定わられた個数ブロックがあり、該個数が予測セグメントの数に依存し ない請求の範囲第4項記載の方法。
- 6.現在のセグメントの予測されるスベクトル振幅が少なくとも一部、前のセグ メントのスベクトル振幅を補間することに基づき、現在のセグメントの周波数で 前のセグメントのスベクトル振幅を推定する請求の範囲第5項に記載の方法。
- 7.現在のセグメントの実際のスベクトル振幅と現在のセグメントの予測された スベクトル振幅の間の差が、実際のスベクトル振幅から予測されたスベクトル振 幅の一部を差分することによって形成される請求の範囲第4項記載の方法。
- 8.スベクトル振幅が多重帯域励起音声モデルを用いて得られる請求の範囲第1 、2又は4項のいずれか一に記載の方法。
- 9.現在のセグメントの予測スベクトル振幅の形成に際して最も最近の前のセグ メントのスベクトル振幅のみが用いられる請求の範囲第1、2又は4項のいずれ か一に記載の方法。
- 10.所与のセグメントに対して周波数の組が該セグメントの基本周波数の倍数 である請求の範囲第1、2又は4項のいずれか一に記載の方法。
- 11.ブロックの偶数が6に等しい請求の範囲第2、5又は6項のいずれか一に 記載の方法。
- 12.低い周波数ブロックにおける予測残基の偶数が高い周波数ブロックにおけ る予測残差の個数よりも大きくない請求の範囲第2、5又は6項のいずれか一に 記載の方法。
- 13.低い周波数ブロックにおける予測残差の偶数が高い周波数ブロックにおけ る予測残差偶の数よりも大きくない請求の範囲第11項記載の方法。
- 14.高い周波数ブロックにおける要素の偶数と低い周波数ブロックにおける要 素の偶数の差が1以下である請求の範囲第13項記載の方法。
- 15.前記平均が、ブロック内においてスベクトル振幅予測残差を加算し該ブロ ック内において予測残差の偶数で除する請求の範囲第4、5又は6項のいずれか 一に記載の方法。
- 16.前記平均が、ブロック内のスベクトル振幅予測残差の離散コサイン変換( DCT)を計算し、且つ平均として該DCTの第1番目の係数を用いることによ って得られる請求の範囲第15項記載の方法。
- 17.PRBA(予測残基ブロック平均)ベクトルが二つの方法、即ち、(1) PRBAベクトルに離散コサイン変換(DCT)などの変換を施し、変換係数を スカラー量子化する方法、(2)PRBAベクトルをベクトル量子化する方法、 の内の一を用いて符号化される請求の範囲第4、5又は6項のいずれか一に記載 の方法。
- 18.前記ベクトル量子化が、 PRBAベクトルの平均を決定し、 該平均をスカラー量子化を用いて量子化し、前記平均をPRBAベクトルから差 し引きゼロ平均PRBAベクトルを形成し、及び、 ゼロ平均コードブックによってベクトル量子化を用いて前記ゼロ平均PRBAベ クトルを量子化する、上記各工程から成る方法を用いて行なわれる請求の範囲第 17項記載の方法。
- 19.音声が複数セグメントに分割され、セグメント内の各セグメントについて 又はセグメント内の各帯域について有声/無声の判定が為され、各セグメントに ついてスベクトルが一組の周波数で標本化されて一組のスベクトル振幅を形成す る、音声符号化の方法において、現在の音声セグメントに対してビット・エラー 率が推定され、予め定められたエラー率閾値と比較され、現在のセグメントにつ いて予め定めるエネルギー閾値よりも高いスベクトル振幅に対する有声/無声の 判定が、推定されたビットエラー率が所定のエラー率閾値よりも高い時、全て有 声であると宣言される音声符号化方法。
- 20.予め定めるエネルギー閾値が現在のセグメントに対するビットエラー率に 依存する請求の範囲第19項記載の方法。
- 21.モデルパラメータによって特徴付けられる音声モデルを用いて音声が符号 化され、音声が時間セグメントに分割され、各セグメントについてモデルバラメ ータが推定され且つ量子化され、及び、量子化されたモデルパラメータの少なく ともいずれかがエラー訂正コーディングを用いて符号化される、音声符号化の方 法において、量子化されたモデルパラメータを符号化するたわに少なくとも二つ の型式のエラー訂正コーディングが用いられ、第2の型式の符号化よりも多くの 追加ビットを加える第1の型式の符号化が、第2群の量子化されたモデルパラメ ータよりもビットエラーに対して感度が高い第1群の量子化されたモデルパラメ ータに対して用いられることを特徴とする音声符号化方法。
- 22.異なった型式のエラー訂正コーディングがゴレイ(Golay)コードと ハミング(Hamming)コードを含む請求の範囲第21項記載の方法。
- 23.モデルパラメータによって特徴付けられる音声モデルを用いて音声が符号 化され、音声が時間セグメントに分割され、各セグメントについてモデルパラメ ータが推定され且つ量子化され、量子化されたモデルパラメータの少なくともい ずれかがエラー訂正コーディングを用いて符号化され、及び、音声がデコードさ れたモデルパラメータから合成される音声符号化の方法において、エラー訂正コ ーディングが合成に際して、エラー率を推定するために用いられ、該パラメータ についてのエラー率が予め定めるレベルを超えた時に、前のセグメントの1又は 複数のモデルパラメータが現在のセグメントにおいて繰り返されることを特徴と する音声合成符号化方法。
- 24.量子化されたパラメータが多帯域励起(MBE)音声コーダ又は改良型多 帯域励起(IMBE)音声コーダと関連したパラメータである請求の範囲第21 、22、又は23項のいずれか一に記載の方法。
- 25.エラー率がエラー訂正符号を用いて推定される請求の範囲第21又は22 項に記載の方法。
- 26.1又は複数のモデルパラメータが推定されたエラー率に基づき複数のセグ メントに渡って平滑化される請求の範囲第25項記載の方法。
- 27.平滑化されるモデルパラメータが、有声/無声の判定を含む請求の範囲第 26項記載の方法。
- 28.平滑化されるパラメータが、多帯域励起(MBE)音声コーダ又は改良型 多帯域励起(IMBE)音声コーダに対するパラメータを含む請求の範囲第26 項記載の方法。
- 29.パラメータに対して推定されたエラー率が予め定めるレベルを超えた時に 、前のセグメントにおける1又は複数のモデルパラメータが現在のセグメントに おいて繰り返される請求の範囲第28項記載の方法。
- 30.音声信号が複数セグメントに分割され、セグメントの周波数領域の表現が 決定されて該ヤグメントのスベクトル包絡を提供し、音声が強調されたスベクト ル包絡から合成される、音声強調の方法において、セグメントの平滑化されたス ベクトル包絡がスベクトル包絡を平滑化することによって生成され、平滑化され たスベクトル包絡よりも大きな振幅を有するスベクトル包絡についてスベクトル 包絡の周波数領域のいくつかを増加させ、且つ平滑化されたスベクトル包絡より も小さな振幅を有するスベクトル包絡についてスベクトル包絡の周波数領域のい くつかを減少させることにより、強調されたスベクトル包絡が生成される音声強 調方法。
- 31.スベクトル包絡の周波数領域表示が多帯域励起(MBE)音声コーダ又は 改良型多帯域励起(IMBE)音声コーダのスベクトル振幅パラメータの組であ る請求の範囲第30項記載の方法。
- 32.平滑化されたスベクトル包絡が、スベクトル包絡から低次モデルを推定す ることによって生成される請求の範囲第30又は31項記載の方法。
- 33.低次モデルが全極形モデルである請求の範囲第32項記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/624,878 US5226084A (en) | 1990-12-05 | 1990-12-05 | Methods for speech quantization and error correction |
US624,878 | 1990-12-05 | ||
PCT/US1991/009135 WO1992010830A1 (en) | 1990-12-05 | 1991-12-04 | Methods for speech quantization and error correction |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06507252A true JPH06507252A (ja) | 1994-08-11 |
JP3467270B2 JP3467270B2 (ja) | 2003-11-17 |
Family
ID=24503712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50295792A Expired - Lifetime JP3467270B2 (ja) | 1990-12-05 | 1991-12-04 | 音声の量子化とエラー訂正のための方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US5226084A (ja) |
EP (3) | EP0560931B1 (ja) |
JP (1) | JP3467270B2 (ja) |
AU (1) | AU657508B2 (ja) |
CA (1) | CA2096425C (ja) |
DE (3) | DE69132013T2 (ja) |
WO (1) | WO1992010830A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005534950A (ja) * | 2002-05-31 | 2005-11-17 | ヴォイスエイジ・コーポレーション | 線形予測に基づく音声コーデックにおける効率的なフレーム消失の隠蔽のための方法、及び装置 |
Families Citing this family (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5247579A (en) * | 1990-12-05 | 1993-09-21 | Digital Voice Systems, Inc. | Methods for speech transmission |
US5630011A (en) * | 1990-12-05 | 1997-05-13 | Digital Voice Systems, Inc. | Quantization of harmonic amplitudes representing speech |
US5765127A (en) * | 1992-03-18 | 1998-06-09 | Sony Corp | High efficiency encoding method |
ES2078834B1 (es) * | 1992-10-30 | 1997-04-16 | Alcatel Standard Electrica | Metodo de segmentacion de cadenas de palabras en la fase de entrenamiento de un reconocedor de palabras conectadas. |
US5517511A (en) * | 1992-11-30 | 1996-05-14 | Digital Voice Systems, Inc. | Digital transmission of acoustic signals over a noisy communication channel |
JP2746033B2 (ja) * | 1992-12-24 | 1998-04-28 | 日本電気株式会社 | 音声復号化装置 |
ATE211326T1 (de) * | 1993-05-31 | 2002-01-15 | Sony Corp | Verfahren und vorrichtung zum kodieren oder dekodieren von signalen und aufzeichnungsmedium |
BR9405445A (pt) * | 1993-06-30 | 1999-09-08 | Sony Corp | Aparelho codificador e decodificador de sinal apropriado para codificar um sinal de entrada e decodificar um sinal codificado, suporte de gravação onde sinais codificados são gravados, e processo de codificação e de decodificação de sinal para codificar um sinal de entrada e decodificar um sinal codificado. |
TW327223B (en) * | 1993-09-28 | 1998-02-21 | Sony Co Ltd | Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal |
US5715365A (en) * | 1994-04-04 | 1998-02-03 | Digital Voice Systems, Inc. | Estimation of excitation parameters |
US5787387A (en) * | 1994-07-11 | 1998-07-28 | Voxware, Inc. | Harmonic adaptive speech coding method and system |
JP3528258B2 (ja) * | 1994-08-23 | 2004-05-17 | ソニー株式会社 | 符号化音声信号の復号化方法及び装置 |
JP3557662B2 (ja) * | 1994-08-30 | 2004-08-25 | ソニー株式会社 | 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置 |
AU696092B2 (en) * | 1995-01-12 | 1998-09-03 | Digital Voice Systems, Inc. | Estimation of excitation parameters |
US5701390A (en) * | 1995-02-22 | 1997-12-23 | Digital Voice Systems, Inc. | Synthesis of MBE-based coded speech using regenerated phase information |
US5754974A (en) * | 1995-02-22 | 1998-05-19 | Digital Voice Systems, Inc | Spectral magnitude representation for multi-band excitation speech coders |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
AT403969B (de) * | 1995-12-04 | 1998-07-27 | Ericsson Schrack Aktiengesells | Verfahren zur kompression eines analogen signals |
WO1997027578A1 (en) * | 1996-01-26 | 1997-07-31 | Motorola Inc. | Very low bit rate time domain speech analyzer for voice messaging |
US6035007A (en) * | 1996-03-12 | 2000-03-07 | Ericsson Inc. | Effective bypass of error control decoder in a digital radio system |
KR100438801B1 (ko) * | 1996-10-30 | 2004-07-16 | 삼성전자주식회사 | 랜덤에러에견고한부호화및복호화장치 |
KR100389898B1 (ko) * | 1996-10-31 | 2003-10-17 | 삼성전자주식회사 | 음성부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법 |
US5968199A (en) * | 1996-12-18 | 1999-10-19 | Ericsson Inc. | High performance error control decoder |
US5839098A (en) | 1996-12-19 | 1998-11-17 | Lucent Technologies Inc. | Speech coder methods and systems |
KR100437900B1 (ko) * | 1996-12-24 | 2004-09-04 | 엘지전자 주식회사 | 음성코덱의음성데이터복원방법 |
JPH10233692A (ja) * | 1997-01-16 | 1998-09-02 | Sony Corp | オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法 |
US6131084A (en) * | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
US6161089A (en) * | 1997-03-14 | 2000-12-12 | Digital Voice Systems, Inc. | Multi-subframe quantization of spectral parameters |
FR2768545B1 (fr) * | 1997-09-18 | 2000-07-13 | Matra Communication | Procede de conditionnement d'un signal de parole numerique |
US6199037B1 (en) | 1997-12-04 | 2001-03-06 | Digital Voice Systems, Inc. | Joint quantization of speech subframe voicing metrics and fundamental frequencies |
KR19990065424A (ko) * | 1998-01-13 | 1999-08-05 | 윤종용 | 저지연 다중밴드 여기 보코더를 위한 피치 결정방식 |
FR2796194B1 (fr) * | 1999-07-05 | 2002-05-03 | Matra Nortel Communications | Procedes et dispositifs d'analyse et de synthese audio |
JP4449108B2 (ja) | 1999-08-05 | 2010-04-14 | パナソニック株式会社 | 音声復号装置 |
KR100474833B1 (ko) * | 1999-11-17 | 2005-03-08 | 삼성전자주식회사 | 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원스펙트럼 진폭 양자화 방법 및 그 장치 |
US6377916B1 (en) | 1999-11-29 | 2002-04-23 | Digital Voice Systems, Inc. | Multiband harmonic transform coder |
ATE303646T1 (de) * | 2000-06-20 | 2005-09-15 | Koninkl Philips Electronics Nv | Sinusoidale kodierung |
US6735563B1 (en) * | 2000-07-13 | 2004-05-11 | Qualcomm, Inc. | Method and apparatus for constructing voice templates for a speaker-independent voice recognition system |
US6732071B2 (en) * | 2001-09-27 | 2004-05-04 | Intel Corporation | Method, apparatus, and system for efficient rate control in audio encoding |
US7027980B2 (en) * | 2002-03-28 | 2006-04-11 | Motorola, Inc. | Method for modeling speech harmonic magnitudes |
US7970606B2 (en) | 2002-11-13 | 2011-06-28 | Digital Voice Systems, Inc. | Interoperable vocoder |
US7634399B2 (en) * | 2003-01-30 | 2009-12-15 | Digital Voice Systems, Inc. | Voice transcoder |
US8359197B2 (en) * | 2003-04-01 | 2013-01-22 | Digital Voice Systems, Inc. | Half-rate vocoder |
TWI275074B (en) * | 2004-04-12 | 2007-03-01 | Vivotek Inc | Method for analyzing energy consistency to process data |
US8825482B2 (en) | 2005-09-15 | 2014-09-02 | Sony Computer Entertainment Inc. | Audio, video, simulation, and user interface paradigms |
KR100857111B1 (ko) * | 2005-10-05 | 2008-09-08 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
WO2007040364A1 (en) | 2005-10-05 | 2007-04-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US8068569B2 (en) | 2005-10-05 | 2011-11-29 | Lg Electronics, Inc. | Method and apparatus for signal processing and encoding and decoding |
US8194754B2 (en) | 2005-10-13 | 2012-06-05 | Lg Electronics Inc. | Method for processing a signal and apparatus for processing a signal |
EP1946555A4 (en) * | 2005-10-13 | 2009-12-30 | Lg Electronics Inc | METHOD AND APPARATUS FOR PROCESSING SIGNALS |
US8019611B2 (en) | 2005-10-13 | 2011-09-13 | Lg Electronics Inc. | Method of processing a signal and apparatus for processing a signal |
US7590523B2 (en) * | 2006-03-20 | 2009-09-15 | Mindspeed Technologies, Inc. | Speech post-processing using MDCT coefficients |
JP4769673B2 (ja) * | 2006-09-20 | 2011-09-07 | 富士通株式会社 | オーディオ信号補間方法及びオーディオ信号補間装置 |
US8036886B2 (en) | 2006-12-22 | 2011-10-11 | Digital Voice Systems, Inc. | Estimation of pulsed speech model parameters |
JP2008281552A (ja) * | 2007-04-09 | 2008-11-20 | Seiko Epson Corp | 初回測位出力位置演算決定方法、プログラム、記憶媒体、測位装置及び電子機器 |
CN101221765B (zh) * | 2008-01-29 | 2011-02-02 | 北京理工大学 | 一种基于语音前向包络预测的差错隐藏方法 |
DE102010041435A1 (de) * | 2010-09-27 | 2012-03-29 | Siemens Medical Instruments Pte. Ltd. | Verfahren zum Rekonstruieren eines Sprachsignals und Hörvorrichtung |
US9948920B2 (en) | 2015-02-27 | 2018-04-17 | Qualcomm Incorporated | Systems and methods for error correction in structured light |
US10068338B2 (en) | 2015-03-12 | 2018-09-04 | Qualcomm Incorporated | Active sensing spatial resolution improvement through multiple receivers and code reuse |
US9530215B2 (en) | 2015-03-20 | 2016-12-27 | Qualcomm Incorporated | Systems and methods for enhanced depth map retrieval for moving objects using active sensing technology |
US9635339B2 (en) | 2015-08-14 | 2017-04-25 | Qualcomm Incorporated | Memory-efficient coded light error correction |
US9846943B2 (en) | 2015-08-31 | 2017-12-19 | Qualcomm Incorporated | Code domain power control for structured light |
US11270714B2 (en) | 2020-01-08 | 2022-03-08 | Digital Voice Systems, Inc. | Speech coding using time-varying interpolation |
US11990144B2 (en) | 2021-07-28 | 2024-05-21 | Digital Voice Systems, Inc. | Reducing perceived effects of non-voice data in digital speech |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3982070A (en) * | 1974-06-05 | 1976-09-21 | Bell Telephone Laboratories, Incorporated | Phase vocoder speech synthesis system |
US3975587A (en) * | 1974-09-13 | 1976-08-17 | International Telephone And Telegraph Corporation | Digital vocoder |
US3995116A (en) * | 1974-11-18 | 1976-11-30 | Bell Telephone Laboratories, Incorporated | Emphasis controlled speech synthesizer |
US4276647A (en) * | 1979-08-02 | 1981-06-30 | Xerox Corporation | High speed Hamming code circuit and method for the correction of error bursts |
US4454609A (en) * | 1981-10-05 | 1984-06-12 | Signatron, Inc. | Speech intelligibility enhancement |
AU570439B2 (en) * | 1983-03-28 | 1988-03-17 | Compression Labs, Inc. | A combined intraframe and interframe transform coding system |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US4856068A (en) * | 1985-03-18 | 1989-08-08 | Massachusetts Institute Of Technology | Audio pre-processing methods and apparatus |
JPS61252596A (ja) * | 1985-05-02 | 1986-11-10 | 株式会社日立製作所 | 文字音声通信方式及び装置 |
US4720861A (en) * | 1985-12-24 | 1988-01-19 | Itt Defense Communications A Division Of Itt Corporation | Digital speech coding circuit |
US4797926A (en) * | 1986-09-11 | 1989-01-10 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech vocoder |
FR2616993B1 (fr) * | 1987-06-16 | 1989-11-24 | Radiotechnique Ind & Comm | Procede et dispositif de correction d'erreurs dans les donnees numeriques d'un signal de television |
US5023910A (en) * | 1988-04-08 | 1991-06-11 | At&T Bell Laboratories | Vector quantization in a harmonic speech coding arrangement |
JPH02203400A (ja) * | 1989-02-01 | 1990-08-13 | Japan Radio Co Ltd | 音声符号化方法 |
US5823910A (en) * | 1995-11-23 | 1998-10-20 | Hyundai Motor Company | Transmission including planetary gear sets |
-
1990
- 1990-12-05 US US07/624,878 patent/US5226084A/en not_active Expired - Lifetime
-
1991
- 1991-12-04 AU AU91470/91A patent/AU657508B2/en not_active Expired
- 1991-12-04 EP EP92902772A patent/EP0560931B1/en not_active Expired - Lifetime
- 1991-12-04 CA CA002096425A patent/CA2096425C/en not_active Expired - Lifetime
- 1991-12-04 JP JP50295792A patent/JP3467270B2/ja not_active Expired - Lifetime
- 1991-12-04 WO PCT/US1991/009135 patent/WO1992010830A1/en active IP Right Grant
- 1991-12-04 EP EP98203160A patent/EP0893791B1/en not_active Expired - Lifetime
- 1991-12-04 DE DE69132013T patent/DE69132013T2/de not_active Expired - Lifetime
- 1991-12-04 DE DE69133458T patent/DE69133458T2/de not_active Expired - Lifetime
- 1991-12-04 DE DE69133058T patent/DE69133058T2/de not_active Expired - Lifetime
- 1991-12-04 EP EP01204836A patent/EP1211669B1/en not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005534950A (ja) * | 2002-05-31 | 2005-11-17 | ヴォイスエイジ・コーポレーション | 線形予測に基づく音声コーデックにおける効率的なフレーム消失の隠蔽のための方法、及び装置 |
JP4658596B2 (ja) * | 2002-05-31 | 2011-03-23 | ヴォイスエイジ・コーポレーション | 線形予測に基づく音声コーデックにおける効率的なフレーム消失の隠蔽のための方法、及び装置 |
Also Published As
Publication number | Publication date |
---|---|
EP0560931A1 (en) | 1993-09-22 |
CA2096425C (en) | 2005-03-22 |
DE69133458T2 (de) | 2006-02-23 |
EP0893791A2 (en) | 1999-01-27 |
EP1211669A2 (en) | 2002-06-05 |
JP3467270B2 (ja) | 2003-11-17 |
AU9147091A (en) | 1992-07-08 |
US5226084A (en) | 1993-07-06 |
EP0560931B1 (en) | 2000-03-01 |
AU657508B2 (en) | 1995-03-16 |
EP0893791B1 (en) | 2002-07-03 |
EP1211669B1 (en) | 2005-05-04 |
CA2096425A1 (en) | 1992-06-06 |
DE69133058T2 (de) | 2002-10-31 |
DE69132013D1 (de) | 2000-04-06 |
WO1992010830A1 (en) | 1992-06-25 |
DE69132013T2 (de) | 2000-11-02 |
EP1211669A3 (en) | 2003-02-05 |
EP0893791A3 (en) | 1999-05-19 |
DE69133458D1 (de) | 2005-06-09 |
EP0560931A4 (ja) | 1995-07-26 |
DE69133058D1 (de) | 2002-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH06507252A (ja) | 音声の量子化とエラー訂正のための方法 | |
US5247579A (en) | Methods for speech transmission | |
US5701390A (en) | Synthesis of MBE-based coded speech using regenerated phase information | |
US5754974A (en) | Spectral magnitude representation for multi-band excitation speech coders | |
JP3343965B2 (ja) | 音声符号化方法及び復号化方法 | |
US7502734B2 (en) | Method and device for robust predictive vector quantization of linear prediction parameters in sound signal coding | |
US6493664B1 (en) | Spectral magnitude modeling and quantization in a frequency domain interpolative speech codec system | |
JP5343098B2 (ja) | スーパーフレーム構造のlpcハーモニックボコーダ | |
US6377916B1 (en) | Multiband harmonic transform coder | |
US8200497B2 (en) | Synthesizing/decoding speech samples corresponding to a voicing state | |
US6691092B1 (en) | Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system | |
EP0927988B1 (en) | Encoding speech | |
JP2004310088A (ja) | 半レート・ボコーダ | |
JP2001509616A (ja) | 長期間予測と多重パルス励起信号を用いて音声信号を符号化および/または復号化する方法 | |
JP2002366195A (ja) | 音声符号化パラメータ符号化方法及び装置 | |
US20100145712A1 (en) | Coding of digital audio signals | |
KR100220783B1 (ko) | 음성 양자화 및 에러 보정 방법 | |
Hernandez-Gomez et al. | Short-time synthesis procedures in vector adaptive transform coding of speech |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080829 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090829 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100829 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110829 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110829 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120829 Year of fee payment: 9 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120829 Year of fee payment: 9 |