RU2001110168A - Речевое кодирование с улучшенным воспроизведением фонового шума - Google Patents
Речевое кодирование с улучшенным воспроизведением фонового шума Download PDFInfo
- Publication number
- RU2001110168A RU2001110168A RU2001110168/09A RU2001110168A RU2001110168A RU 2001110168 A RU2001110168 A RU 2001110168A RU 2001110168/09 A RU2001110168/09 A RU 2001110168/09A RU 2001110168 A RU2001110168 A RU 2001110168A RU 2001110168 A RU2001110168 A RU 2001110168A
- Authority
- RU
- Russia
- Prior art keywords
- parameter
- current
- parameters
- determinant
- stationarity
- Prior art date
Links
- 238000000034 method Methods 0.000 claims 19
- 239000003607 modifier Substances 0.000 claims 12
- 238000012935 Averaging Methods 0.000 claims 7
- 239000003638 chemical reducing agent Substances 0.000 claims 7
- 238000004891 communication Methods 0.000 claims 4
- 230000005284 excitation Effects 0.000 claims 2
- 230000002194 synthesizing effect Effects 0.000 claims 2
- 238000011084 recovery Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Claims (33)
1. Способ получения приближения исходного речевого сигнала из кодированной информации об исходном речевом сигнале, отличающийся тем, что определяют посредством определителя (11, 41) параметров текущие параметры, связанные с текущим сегментом исходного речевого сигнала, из кодированной информации, и для по меньшей мере одного из текущих параметров, используют этот текущий параметр и соответствующие предыдущие параметры, соответственно связанные с предыдущими сегментами исходного речевого сигнала, для получения модифицированного параметра посредством модификатора (21), и использование этого модифицированного параметра для получения приближения текущего сегмента исходного речевого сигнала посредством речевого восстановления (25).
2. Способ по п. 1, по которому модифицированный параметр отличается от текущего параметра.
3. Способ по п. 1, по которому текущий параметр является параметром, показывающим энергию сигнала в текущем сегменте исходного речевого сигнала.
4. Способ по п. 3, по которому этап использования текущего и предыдущего параметров включает в себя использование предыдущих параметров в операции усреднения посредством усреднителя (39, 47) для получения усредненного параметра и использование этого усредненного параметра вместе с текущим параметром для получения модифицированного параметра.
5. Способ по п. 4, по которому этап использования текущего и усредненного параметров включает в себя определение коэффициента смешивания посредством определителя (35, 45) коэффициента смешивания, указывающего относительную важность текущего параметра и усредненного параметра в получении модифицированного параметра.
6. Способ по п. 5, по которому этап определения коэффициента смешивания включает в себя определение меры стационарности посредством определителя (33, 43) стационарности, показывающей характеристику стационарности шумового компонента, связанного с текущим сегментом исходного речевого сигнала, и определение коэффициента смешивания посредством определителя (35) коэффициента смешивания как функции меры стационарности.
7. Способ по п. 6, по которому этап определения меры стационарности посредством определителя (33, 43) стационарности включает в себя, для по меньшей мере других параметров, использование текущего параметра и соответствующих предыдущих параметров, соответственно связанных с предыдущими сегментами исходного речевого сигнала, для определения меры стационарности.
8. Способ по п. 7, по которому последний этап использования текущего и предыдущего параметров включает в себя применение операции усреднения к предыдущим параметрам для получения усредненного параметра и использование этого усредненного параметра вместе с текущим параметром для определения меры стационарности.
9. Способ по п. 7, по которому другой текущий параметр является коэффициентом фильтрации синтезирующего фильтра, используемого в получении приближения исходного речевого сигнала.
10. Способ по п. 5, по которому этап использования текущего и предыдущего параметров включает в себя определение из коэффициента смешивания посредством определителя (35) коэффициента смешивания дальнейших коэффициентов, соответственно связанных с текущим и усредненным параметрами, и умножение текущего и усредненного параметров на соответствующие дальнейшие коэффициенты.
11. Способ по п. 4, по которому этап использования предыдущих параметров в операции усреднения включает в себя выборочное изменение операции усреднения в ответ на условия канала связи, используемые для получения кодированной информации.
12. Способ по п. 3, по которому этап использования текущего и предыдущего параметров включает в себя определение коэффициента смешивания, показывающего важность предыдущих параметров по отношению к текущему параметру в получении модифицированного параметра.
13. Способ по п. 12, по которому этап определения коэффициента смешивания включает в себя определение меры стационарности, показывающей характеристику стационарности шумовой компоненты, связанной с текущим сегментом исходного речевого сигнала, и определение коэффициента смешивания как функции меры стационарности.
14. Способ по п. 12, по которому этап определения коэффициента смешивания включает в себя выборочное изменение коэффициента смешивания в ответ на условия канала связи, используемые для получения кодированной информации.
15. Способ по п. 3, по которому текущий параметр является фиксированным усилением из кодового словаря для использования в процессе речевого декодирования по методу линейного предсказания с кодовым возбуждением.
16. Речевое кодирующее устройство, отличающееся тем, что оно содержит вход для приема кодированной информации, из которой следует получить приближение исходного речевого сигнала, выход для выведения упомянутого приближения, определитель (11) параметров, связанный с входом, для определения текущих параметров, используемых в получении приближения текущего сегмента исходного речевого сигнала, из кодированной информации, восстановитель (25), включенный между определителем параметров и выходом, для получения приближения исходного речевого сигнала, и модификатор (21), включенный между определителем параметров и восстановителем, для использования по меньшей мере одного из текущих параметров и соответствующих предыдущих параметров, соответственно связанных с предыдущими сегментами исходного сигнала, для получения модифицированного параметра, причем модификатор служит далее для выдачи модифицированного параметра в восстановитель для использования в получении приближения текущего сегмента исходного речевого сигнала.
17. Устройство по п. 16, в котором модифицированный параметр отличается от текущего параметра.
18. Устройство по п. 16, в котором текущий параметр является индикацией параметра мощности сигнала в текущем сегменте исходного речевого сигнала.
19. Устройство по п. 18, в котором модификатор включает в себя усреднитель (39) для использования предыдущих параметров в операции усреднения для получения усредненного параметра, причем модификатор действует для использования усредненного параметра вместе с текущим параметром для получения модифицированного параметра.
20. Устройство по п. 19, в котором модификатор включает в себя определитель (35) коэффициента смешивания для определения коэффициента смешивания, показывающего относительную важность текущего параметра и усредненного параметра для получения модифицированного параметра.
21. Устройство по п. 20, в котором модификатор включает в себя определитель (33) стационарности, включенный между определителем параметров и определителем коэффициента смешивания, для определения меры стационарности, показывающей характеристику стационарности шумового компонента текущего сегмента, причем определитель коэффициента смешивания действует для определения коэффициента смешивания как функции меры стационарности.
22. Устройство по п. 21, в котором определитель стационарности действует для использования по меньшей мере других текущих параметров и соответствующих предыдущих параметров, соответственно связанных с предыдущими сегментами исходного речевого сигнала, для определения меры стационарности.
23. Устройство по п. 22, в котором определитель стационарности далее действует для применения операции усреднения к предыдущим параметрам, соответствующим по меньшей мере другому текущему параметру, для получения дальнейшего усредненного параметра, и для использования дальнейшего усредненного параметра вместе с другим текущим параметром для определения меры стационарности.
24. Устройство по п. 22, в котором другой текущий параметр является фильтровым коэффициентом синтезирующего фильтра, воплощенным восстановителем при получении приближения исходного речевого сигнала.
25. Устройство по п. 20, в котором модификатор включает в себя логику (37) смешивания, включенную между определителем (35) коэффициента смешивания и восстановителем (25), для определения из коэффициента смешивания дальнейших коэффициентов, соответственно связанных с текущим параметром и усредненным параметром, и для умножения текущего и усредненного параметров на соответствующие дальнейшие коэффициенты для получения соответствующих произведений, причем логика смешивания действует для получения модифицированного параметра в ответ на упомянутые произведения.
26. Устройство по п. 19, в котором усреднитель (39) включает в себя вход для приема информации, показывающей состояния канала, из которого принимается кодированная информация, причем усреднитель отвечает на информацию для выборочного изменения операции усреднения.
27. Устройство по п. 18, в котором модификатор (21) включает в себя определитель (35) коэффициента смешивания для определения коэффициента смешивания, показывающего важность предыдущих параметров по отношению к текущему параметру в получении модифицированного параметра.
28. Устройство по п. 27, в котором модификатор (21) включает в себя определитель (33) стационарности, включенный между определителем (11) параметров и определителем (35) коэффициента смешивания, для определения меры стационарности, показывающей характеристику стационарности шумового компонента текущего сегмента, причем определитель коэффициента смешивания действует для определения коэффициента смешивания как функции меры стационарности.
29. Устройство по п. 27, в котором определитель коэффициента смешивания включает в себя вход для приема информации, показывающей состояния канала, из которого принимается кодированная информация, причем определитель коэффициента смешивания отвечает на информацию для выборочного изменения коэффициента смешивания.
30. Устройство по п. 18, в котором текущий параметр является фиксированным усилением из кодового словаря для использования в процессе речевого декодирования по методу линейного предсказания с кодовым возбуждением.
31. Устройство по п. 16, в котором устройство речевого декодирования включает в себя речевой декодер линейного предсказания с кодовым возбуждением.
32. Устройство приемопередатчика для использования в системе связи, отличающееся тем, что оно содержит вход для приема информации от передатчика по каналу (55) связи, выход для обеспечения выхода к пользователю приемопередатчика, устройство (52) речевого декодирования, имеющее вход, связанный с входом приемопередатчика, и выход, связанный с выходом приемопередатчика, причем вход устройства речевого декодирования служит для приема из входа приемопередатчика кодированной информации, из которой следует получать приближение исходного речевого сигнала, а выход устройства речевого декодирования служит для получения приближения на выход приемопередатчика, причем устройство (52) речевого декодирования далее включает в себя определитель (11) параметров, связанный с входом устройства речевого кодирования, для определения из кодированной информации текущих параметров, подлежащих использованию в получении приближения текущего сегмента исходного речевого сигнала, восстановитель (25), включенный между определителем параметров и выходом устройства речевого декодирования, для получения приближения исходного речевого сигнала, и модификатор (21), включенный между определителем параметров и восстановителем, для использования по меньшей мере одного из текущих параметров и соответствующих предыдущих параметров, соответственно связанных с предыдущими сегментами исходного речевого сигнала, для получения модифицированного параметра, причем модификатор далее служит для подачи модифицированного параметра в восстановитель для использования в получении приближения текущего сегмента исходного речевого сигнала.
33. Устройство по п. 32, в котором устройство приемопередатчика является частью сотового телефона.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/154,361 | 1998-09-16 | ||
US09/154,361 US6275798B1 (en) | 1998-09-16 | 1998-09-16 | Speech coding with improved background noise reproduction |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2001110168A true RU2001110168A (ru) | 2003-03-10 |
Family
ID=22551052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2001110168/09A RU2001110168A (ru) | 1998-09-16 | 1999-09-10 | Речевое кодирование с улучшенным воспроизведением фонового шума |
Country Status (15)
Country | Link |
---|---|
US (1) | US6275798B1 (ru) |
EP (2) | EP1879176B1 (ru) |
JP (1) | JP4309060B2 (ru) |
KR (1) | KR100688069B1 (ru) |
CN (1) | CN1244090C (ru) |
AU (1) | AU6377499A (ru) |
BR (1) | BR9913754A (ru) |
CA (1) | CA2340160C (ru) |
DE (2) | DE69942288D1 (ru) |
HK (1) | HK1117629A1 (ru) |
MY (1) | MY126550A (ru) |
RU (1) | RU2001110168A (ru) |
TW (1) | TW454167B (ru) |
WO (1) | WO2000016313A1 (ru) |
ZA (1) | ZA200101222B (ru) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6453285B1 (en) * | 1998-08-21 | 2002-09-17 | Polycom, Inc. | Speech activity detector for use in noise reduction system, and methods therefor |
JP2000172283A (ja) * | 1998-12-01 | 2000-06-23 | Nec Corp | 有音検出方式及び方法 |
JP3451998B2 (ja) * | 1999-05-31 | 2003-09-29 | 日本電気株式会社 | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 |
JP4464707B2 (ja) * | 2004-02-24 | 2010-05-19 | パナソニック株式会社 | 通信装置 |
US8566086B2 (en) * | 2005-06-28 | 2013-10-22 | Qnx Software Systems Limited | System for adaptive enhancement of speech signals |
CN101627426B (zh) | 2007-03-05 | 2013-03-13 | 艾利森电话股份有限公司 | 用于控制稳态背景噪声的平滑的方法和设备 |
EP2132731B1 (en) | 2007-03-05 | 2015-07-22 | Telefonaktiebolaget LM Ericsson (publ) | Method and arrangement for smoothing of stationary background noise |
CN101320563B (zh) * | 2007-06-05 | 2012-06-27 | 华为技术有限公司 | 一种背景噪声编码/解码装置、方法和通信设备 |
CN102667927B (zh) * | 2009-10-19 | 2013-05-08 | 瑞典爱立信有限公司 | 语音活动检测的方法和背景估计器 |
JP5840075B2 (ja) * | 2012-06-01 | 2016-01-06 | 日本電信電話株式会社 | 音声波形データベース生成装置、方法、プログラム |
DE102017207943A1 (de) * | 2017-05-11 | 2018-11-15 | Robert Bosch Gmbh | Signalbearbeitungsvorrichtung für ein insbesondere in ein Batteriesystem einsetzbares Kommunikationssystem |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4630305A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US4969192A (en) | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
IL84948A0 (en) * | 1987-12-25 | 1988-06-30 | D S P Group Israel Ltd | Noise reduction system |
US5179626A (en) * | 1988-04-08 | 1993-01-12 | At&T Bell Laboratories | Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis |
US5008941A (en) * | 1989-03-31 | 1991-04-16 | Kurzweil Applied Intelligence, Inc. | Method and apparatus for automatically updating estimates of undesirable components of the speech signal in a speech recognition system |
US5148489A (en) * | 1990-02-28 | 1992-09-15 | Sri International | Method for spectral estimation to improve noise robustness for speech recognition |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
US5615298A (en) * | 1994-03-14 | 1997-03-25 | Lucent Technologies Inc. | Excitation signal synthesis during frame erasure or packet loss |
US5991725A (en) * | 1995-03-07 | 1999-11-23 | Advanced Micro Devices, Inc. | System and method for enhanced speech quality in voice storage and retrieval systems |
GB2317084B (en) | 1995-04-28 | 2000-01-19 | Northern Telecom Ltd | Methods and apparatus for distinguishing speech intervals from noise intervals in audio signals |
US5794199A (en) | 1996-01-29 | 1998-08-11 | Texas Instruments Incorporated | Method and system for improved discontinuous speech transmission |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
-
1998
- 1998-09-16 US US09/154,361 patent/US6275798B1/en not_active Expired - Lifetime
-
1999
- 1999-08-16 TW TW088113970A patent/TW454167B/zh not_active IP Right Cessation
- 1999-08-25 MY MYPI99003657A patent/MY126550A/en unknown
- 1999-09-10 WO PCT/SE1999/001582 patent/WO2000016313A1/en active IP Right Grant
- 1999-09-10 BR BR9913754-2A patent/BR9913754A/pt not_active IP Right Cessation
- 1999-09-10 DE DE69942288T patent/DE69942288D1/de not_active Expired - Lifetime
- 1999-09-10 KR KR1020017002853A patent/KR100688069B1/ko not_active IP Right Cessation
- 1999-09-10 DE DE69935233T patent/DE69935233T2/de not_active Expired - Lifetime
- 1999-09-10 RU RU2001110168/09A patent/RU2001110168A/ru not_active Application Discontinuation
- 1999-09-10 CN CNB998109444A patent/CN1244090C/zh not_active Expired - Lifetime
- 1999-09-10 EP EP07002235A patent/EP1879176B1/en not_active Expired - Lifetime
- 1999-09-10 CA CA2340160A patent/CA2340160C/en not_active Expired - Lifetime
- 1999-09-10 JP JP2000570769A patent/JP4309060B2/ja not_active Expired - Lifetime
- 1999-09-10 AU AU63774/99A patent/AU6377499A/en not_active Abandoned
- 1999-09-10 EP EP99951312A patent/EP1112568B1/en not_active Expired - Lifetime
-
2001
- 2001-02-13 ZA ZA200101222A patent/ZA200101222B/en unknown
-
2008
- 2008-07-16 HK HK08107885.5A patent/HK1117629A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR100688069B1 (ko) | 2007-02-28 |
EP1112568B1 (en) | 2007-02-21 |
DE69935233D1 (de) | 2007-04-05 |
US6275798B1 (en) | 2001-08-14 |
EP1879176B1 (en) | 2010-04-21 |
BR9913754A (pt) | 2001-06-12 |
TW454167B (en) | 2001-09-11 |
KR20010090438A (ko) | 2001-10-18 |
EP1879176A2 (en) | 2008-01-16 |
EP1879176A3 (en) | 2008-09-10 |
JP2002525665A (ja) | 2002-08-13 |
MY126550A (en) | 2006-10-31 |
CA2340160C (en) | 2010-11-30 |
CA2340160A1 (en) | 2000-03-23 |
DE69935233T2 (de) | 2007-10-31 |
JP4309060B2 (ja) | 2009-08-05 |
WO2000016313A1 (en) | 2000-03-23 |
AU6377499A (en) | 2000-04-03 |
ZA200101222B (en) | 2001-08-16 |
EP1112568A1 (en) | 2001-07-04 |
CN1244090C (zh) | 2006-03-01 |
CN1318187A (zh) | 2001-10-17 |
DE69942288D1 (de) | 2010-06-02 |
HK1117629A1 (en) | 2009-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10438601B2 (en) | Method and arrangement for controlling smoothing of stationary background noise | |
JP3182032B2 (ja) | 音声符号化通信方式及びその装置 | |
JP3781495B2 (ja) | ディジタル音声伝送システムの快適ノイズを作る方法と装置 | |
US7426465B2 (en) | Speech signal decoding method and apparatus using decoded information smoothed to produce reconstructed speech signal to enhanced quality | |
JP4489960B2 (ja) | 音声の無声セグメントの低ビットレート符号化 | |
US20050143984A1 (en) | Multirate speech codecs | |
RU2001110168A (ru) | Речевое кодирование с улучшенным воспроизведением фонового шума | |
JPH1039898A (ja) | 音声信号伝送方法及び音声符号復号化システム | |
JPH0850500A (ja) | 音声エンコーダ及び音声デコーダ、並びに音声符号化方法及び音声復号化方法 | |
EP1235204A3 (en) | Method and apparatus for selecting an excitation coding mode for speech coding | |
US8515744B2 (en) | Method for encoding signal, and method for decoding signal | |
KR20010112480A (ko) | 전환 스피치 프레임의 멀티펄스 보간 코딩 | |
KR960009752A (ko) | 동화상 부호화 방법 및 동화상 부호화 장치 | |
US20020161573A1 (en) | Speech coding/decoding appatus and method | |
JP3518737B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化信号記録媒体 | |
US7536298B2 (en) | Method of comfort noise generation for speech communication | |
TW359919B (en) | Image coding apparatus, image coding method, image decoding method, image decoding apparatus, image data transmitting method and recording medium | |
US20050102136A1 (en) | Speech codecs | |
JP2541484B2 (ja) | 音声符号化装置 | |
JP3954288B2 (ja) | 音声符号化信号変換装置 | |
US6134519A (en) | Voice encoder for generating natural background noise | |
JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
JP2001083996A (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
JPH09120300A (ja) | ベクトル量子化装置 | |
JPH10124097A (ja) | 音声記録再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA93 | Acknowledgement of application withdrawn (no request for examination) |
Effective date: 20080625 |